25/1/1数据挖掘中的特征选择1数据挖掘中的数据归约问题25/1/1数据挖掘中的特征选择2为什么需要数据挖掘数据爆炸问题自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析
我们拥有丰富的数据,但却缺乏有用的信息数据爆炸但知识贫乏25/1/1数据挖掘中的特征选择3数据挖掘的作用数据挖掘:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束)数据挖掘是一种从大量数据中寻找其规律的技术
它综合了统计学、数据库技术和人工智能技术25/1/1数据挖掘中的特征选择4数据挖掘数据库越来越大有价值的知识海量的数据25/1/1数据挖掘中的特征选择5数据挖掘的应用数据分析和决策支持市场分析和管理客户关系管理(CRM),市场占有量分析,交叉销售,目标市场风险分析和管理风险预测,客户保持,保险业的改良,质量控制,竞争分析欺骗检测和异常模式的监测(孤立点)其他的应用文本挖掘(新闻组,电子邮件,文档)和Web挖掘流数据挖掘DNA和生物数据分析25/1/1数据挖掘中的特征选择6数据挖掘:数据库中的知识挖掘(KDD)数据挖掘—知识挖掘的核心数据清理数据集成数据库数据仓库任务相关数据选择数据挖掘模式评估25/1/1数据挖掘中的特征选择7数据挖掘的步骤了解应用领域了解相关的知识和应用的目标创建目标数据集:选择数据数据清理和预处理:(这个可能要占全过程60%的工作量)数据缩减和变换找到有用的特征,维数缩减/变量缩减,不变量的表示选择数据挖掘的功能数据总结,分类模型数据挖掘,回归分析,关联规则挖掘,聚类分析等25/1/1数据挖掘中的特征选择8选择挖掘算法数据挖掘:寻找感兴趣的模式模式评估和知识表示可视化,转换,消除冗余模式等等运用发现的知识25/1/1数据挖掘中的特征选择9数据挖掘和商业智能支持商业决