LOGOwww
nordridesign
com11数据挖掘原理与SPSSClementine应用宝典元昌安主编邓松李文敬刘海涛编著电子工业出版社•数据挖掘的体系结构•数据挖掘的过程模型•Fayyad模型•CRISP-DM模型LOGOwww
nordridesign
com333
1数据挖掘的体系结构数据挖掘系统由各类数据库、挖掘前处理模块、挖掘操作模块、模式评估模块、知识输出模块组成,这些模块的有机组成就构成了数据挖掘系统的体系结构
数据清理集成抽取转换挖掘前处理模块挖掘结果评估模式评估模块系统外数据库数据挖掘处理挖掘操作模块知识输出知识输出模块数据库管理模块各类数据库数据仓库挖掘知识库模式用户数据挖掘系统的体系结构图LOGOwww
nordridesign
com443
1数据挖掘的体系结构•数据库管理模块,负责对系统内数据库、数据仓库、挖掘知识库的维护与管理
这些数据库、数据仓库是对外部数据库进行转换、清理、净化得到,它是数据挖掘的基础
•挖掘前处理模块,对所收集到的数据进行清理、集成、选择、转换,生成数据仓库或数据挖掘库
其中:清理,主要清除噪音;集成,将多种数据源组合在一起;选择,选择与问题相关的数据;转换,将选择数据转换成可挖掘形式
LOGOwww
nordridesign
com553
1数据挖掘的体系结构•模式评估模块,对数据挖掘结果进行评估
由于所挖掘出的模式可能有许多,需要将用户的兴趣度与这些模式进行分析对比,评估模式价值,分析不足原因,如果挖掘出的模式与用户兴趣度相差大,需返回相应的过程(如,挖掘前处理或挖掘操作)重新执行
•知识输出模块,完成对数据挖掘出的模式进行翻译、解释,以人们易于理解的方式提供给真正渴望知识的决策者使用
LOGOwww
nordridesign
com663
1数据挖掘的体系结构•挖掘操作模块,利用各种数据挖掘算法针对数据库、数