通过 Python 中的 Apriori 算法进行关联规则挖掘数据分析报告关联规则挖掘是一种识别不同项目之间潜在关系的技术
以超级市场为例,客户可以在这里购买各种商品
通常,客户购买的商品有一种模式
例如,有婴儿的母亲购买婴儿产品,如牛奶和尿布
少女可以购买化妆品,而单身汉可以购买啤酒和薯条等
总之,交易涉及一种模式
假如可以识别在不同交易中购买的物品之间的关系,则可以产生更多的利润
例如,假如项目 A 和项目 B 的购买频率更高,则可以实行几个步骤来增加利润
A 和 B 可以放在一起,这样,当客户购买其中一种产品时,他不必走很远就可以购买另一种产品
购买某一种产品的人可以通过广告活动来定位以购买另一种产品
假如客户购买了这两种产品,则可以在这些产品上提供折扣
A 和 B 都可以包装在一起
识别产品之间的关联的过程称为关联规则挖掘
关联规则挖掘的 Apriori 算法已经开发出不同的统计算法来实现关联规则挖掘,而 Apriori 就是这样一种算法
在本文中,我们将讨论 Apriori 算法 背后的理论,稍后将在 Python 中实现Apriori 算法
先验算法理论支持度支持是指商品的默认受欢迎程度,可以通过查找包含特定商品的交易数量除以交易总数来计算
假设我们想找到对项目 B 的支持
可以将其计算为:Support(B) = (Transactions containing (B))/(Total Transactions)例如,假如在 1000 个事务中,有 100 个事务包含 Ketchup,则对项目 Ketchup的支持可以计算为:Support(Ketchup) = (Transactions containingKetchup)/(Total Transactions)Support(Ketchup) = 100/1000 = 10