Matlabsky论坛Matlab数据挖掘公开课王小川同济大学经管学院博士研究生新浪微博:http://weibo.com/hgsz20032论坛交流地址http://www.matlabsky.com/forum-96-1.html•发布视频、数据和ppt•交流沟通•我的新浪微博:王小川_matlab•我的论坛ID:Yaksa•说明:本次公开课中的数据挖掘技术不适用于视频和音频数据挖掘。3综合篇•一数据挖掘概论•二数据•三数据可视化(3.1MATLAB介绍、3.2MATLAB可视化、3.3MATLAB数据预处理)•四分类(概念、决策树模型、ANN)•五关联分析(概念、算法)•六聚类分析(概念、算法、实现)•七异常检测4专题篇•神经网络的MATLABGUI实现•决策树的来龙去脉•人人网好友推荐系统•新浪微博营销效果评价系统•信用卡申请者按低、中、高风险分类•电商购物车的那点事•网站优化与数据挖掘5数据分析(挖掘)流程6分析前的挑战•数据访问格式化的数据异构数据管理可视化(基于点击,非代码)•数据质量丢失数据处理离群数据处理7实战一•Basicintroduction数据导入数据处理数据可视化(点击)数据筛选本数据来源于Mathwoks工程师魏奋讲解所用数据8实战二•数据合并数据合并outerinnerMergeKeys合并后处理缺失值查找缺失值填补(fiting)9实战三•数据缺失处理内插法interp1拟合法fit10实战四•数据奇异值处理•GUI处理0510152025303540-1.4-1.2-1-0.8-0.6-0.4-0.200.20.40.6ResidualsTime(s)Outliersat3sigma0120253035242243244245246247248249NoisyandCleanedDataOriginalDataCleanedData242526272829245.5246246.5247247.5248DatawithConfidenceBoundsEstimateModifiedDataConfidenceBounds11下一讲:数据挖掘中的分类算法•概念•机器学习原理•决策树treebagger•神经网络•贝叶斯网络•随机森林•SVMThankYou!