电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

Clementine数据挖掘快速上手

Clementine数据挖掘快速上手_第1页
1/27
Clementine数据挖掘快速上手_第2页
2/27
Clementine数据挖掘快速上手_第3页
3/27
数据挖掘快速上手Version1.0Preparedby 高处不胜寒QQ群:群:14094415140944152009-10-15、Clementine数据挖掘的基本思想数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,它是一种深层次的数据分析方法。随着科技的发展,数据挖掘不再只依赖在线分析等传统的分析方法。它结合了人工智能( AI)和统计分析的长处,利用人工智能技术和统计的应用程序,并把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。Clementine 为我们提供了大量的人工智能、统计分析的模型(神经网络,关联分析,聚类分析、因子分析等),并用基于图形化的界面为我们认识、了解、熟悉这个软件提供了方便。除了这些Clementine 还拥有优良的数据挖掘设计思想,正是因为有了这个工作思想,我们每一步的工 作也变得很清晰。(如图一所示)CRICRISSP-DM processmomoddel如图可知,CRISP-DM Model包含了六个步骤, 并用箭头指示了步骤间的执行顺序。 这些顺序并不严格,用户可以根据实际的需要反向执行某个步骤,也可以跳过某些步骤不予执行。通过对这些步骤的执行,我们也涵盖了数据挖掘的关键部分。商业理解(Businessununderderdersstandndiing):商业理解阶段应算是数据挖掘中最重要的一个部分,在这个阶段里我们需要明确商业目标、评估商业环境、确定挖掘目标以及产生一个项目计划。数据理解(Data undunderererstandingstandingstanding)):数据是我们挖掘过程的 “原材料”,在数据理解过程中我们要知道都有些什么数据,这些数据的特征是什么,可以通过对数据的描述性分析得到数据的特点。数据准备(Date preparatationionion)):在数据准备阶段我们需要对数据作出选择、清洗、重建、合并等工作。 选出要进行分析的数据,并对不符合模型输入要求的数据进行规范化操作。建模(MoModdelinlingg):建模过程也是数据挖掘中一个比较重要的过程。我们需要根据分析目的选出适合的模型工具,通过样本建立模型并对模型进行评估。模型评估(Evaluataluatiionon)):并不是每一次建模都能与我们的目的吻合,评价阶段旨在对建模结果进行评估,对效果较差的结果我们需要分析原因,有时还需要返回前面的步骤对挖掘过程重新定义。结果部署(DeploymentDeployment)):这个阶段是用建立的模型去解决实际中...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

Clementine数据挖掘快速上手

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部