关联规则数据挖掘学习报告1目录引言2案例2关联规则3(一)关联规则定义(二)相关概念(三)关联规则分类数据6(一)小型数据(二)大型数据应用软件7(一)WEKA(二)IBMSPSSModeler数据挖掘12总结272一、引言数据库与互联网技术在日益发展壮大,人们每天可以获得的信息量呈指数级增长
如何从这浩如瀚海的数据中找出我们需要的数据显得尤为重要
数据挖掘又为资料探勘、数据采矿
它是数据库知识发现中的一个步骤
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标
数据挖掘大致分为以下几类:分类(Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinitygroupingorassociationrules)、聚类(Clustering)、复杂数据类型挖掘(Text,Web,图形图像,视频,音频等)
二、案例"尿布与啤酒"的故事
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售
但是这个奇怪的举措却使尿布和啤酒的销量双双增加了
这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道
沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些
沃尔玛数据仓库里集中了其各门店的详细原始交易数据
在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘
一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒
经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常