统计分析、数据挖掘与商业智能应用研究小组关联规则--CARMAContinuousAssociationRuleMiningAlgorithm报告人:徐启元指导教师:谢邦昌日期:2007年11月30日统计分析、数据挖掘与商业智能应用研究小组目录关联规则基本概念CARMA算法简介CARMA模块的基本概念案例分析及Clementine操作步骤购物篮分析----Tabular类型数据网络日志分析----Transactional类型数据值得注意的问题CARMA算法原理(参考)统计分析、数据挖掘与商业智能应用研究小组关联规则算法简介•关联分析的目的是寻找数据项间的相关性.常用技术:–关联规则:即寻找在同一个事件中出现的不同项目的相关性•例如:找出顾客经常同时购买哪些商品
网民浏览的网页之间有没有什么关联性
统计分析、数据挖掘与商业智能应用研究小组CARMA算法简介CARMA是一种比较新的关联规则算法,它是1999年由Berkeley大学的ChristianHidber教授提出来的
1234能够处理在线连续交易流数据仅需一次,最多两次对数据的扫描就可以构造出结果集允许在算法执行过程中按需要重新设置支持度占用内存少CARMAOn-line统计分析、数据挖掘与商业智能应用研究小组CARMA模块中的基本概念•Antecedent&Consequent它们指的是规则的前项和后项
•Instances对于每一条规则,它的Instances值指的是所有记录中包含该规则的antecedent的记录的数量
面包牛奶前项Antecedent后项ConsequentIDP1P2P3P41breadcheesebutterwater2watermilkbreadnoodle3orangenoodlemeatbeer4fishsoftdrinkfrozenmealbread总共4条购买数据,