SPSS Clementine 数据挖掘入门 (1) SPSS Clementine 是Spss 公司收购ISL 获得的数据挖掘工具
在Gartner 的客户数据挖掘工具评估中,仅有两家厂商被列为领导者:SAS 和SPSS
SAS 获得了最高ability to execute 评分,代表着SAS 在市场执行、推广、认知方面有最佳表现;而 SPSS 获得了最高的completeness of vision,表明 SPSS 在技术创新方面遥遥领先
客户端基本界面 SPSS Clementine(在此简称 clementine)在安装好后会自动启用服务,服务端的管理需要使用 SPSS Predictive Enterprise Manager,在服务端 clementine 没有复杂的管理工具,一般的数据挖掘人员通过客户端完成所有工作
下面就是clementine 客户端的界面
一看到上面这个界面,我相信只要是使用过S S IS +S S AS 部署数据挖掘模型的,应该已经明白了六、七分
是否以跃跃欲试了呢,别急,精彩的还在后面 ^_’ 项目区 顾名思义,是对项目的管理,提供了两种视图
其中CRISP-DM (Cross Industry Standard Process for Data Mining,数据挖掘跨行业标准流程)是由SPSS、DaimlerChrysler(戴姆勒克莱斯勒,汽车公司)、NCR(就是那个拥有 Teradata 的公司)共同提出的
Clementine 里通过组织 CRISP-DM 的六个步骤完成项目
在项目中可以加入流、节点、输出、模型等
工具栏 工具栏总包括了ETL、数据分析、挖掘模型工具,工具可以加入到数据流设计区中,跟 SSIS 中的数据流非常相似
Clementine 中有 6 类工具
源工具(Sou rces) 相当 SSIS 数