11数据挖掘原理与SPSSClementine应用宝典元昌安主编邓松李文敬刘海涛编著电子工业出版社22•概念/类描述•关联模式•分类•聚类分析•预测•时间序列•偏差检测33概念/类描述就是通过对某类对象关联数据的汇总、分析和比较,用汇总的、简洁的、精确的方式对此类对象的内涵进行描述,并概括这类对象的有关特征
概念描述分为特征性描述和区别性描述
特征性描述是指从与某类对象相关的一组数据中提取出关于这些对象的共同特征
生成一个类的特征性描述只涉及该类对象中所有对象的共性
区别性描述描述两个或更多个不同类对象之间的差异
生成区别性描述则涉及目标类和对比类中对象的共性
1概念/类描述442
1概念/类描述数据特征的输出可以用多种形式提供
包括饼图、条图、曲线、多维数据方和包括交叉表在内的多维表
结果描述也可以用泛化关系或规则(称作特征规则)形式提供
例如:利用面向属性的归纳方法(AOI),在一个商场数据库(2000销售)中进行属性归纳操作,获得了如下的归纳结果:表2-1AOI方法挖掘结果表格表示示意描述地点商品销售额(百万)个数累计(千)亚洲欧洲北美亚洲欧洲北美电视电视电视电脑电脑电脑151228120150200300250450100012001800552
1概念/类描述对于以上结果,也可以用组合表(crosstab)或其他图表的形式来加以描述
数据分析中可视化图示非常普遍
表2-2对应表2-1的组合表表示描述图2-1对应表2-2棒图表示描述TVComputerTV+ComputersalescountsalescountsalescountAsia1530012010001351300Europe1225015012001621450North_Amaerica2845020018002282250All_region45100047040005255000item