第六章 数据挖掘导论 1
对于每个下列问题,提供一个关联规则的一个例子 从市场购物篮域,满足下列条件
同样, 这些规则是主观地描述是否有趣
(一)一个规则,具有较高的支持和高的信心
答:牛奶−→面包
这种明显的规则往往是无趣的
(b)规则,有相当高的支持,但信心不足
答:牛奶−→金枪鱼
而出售金枪鱼和牛奶可能是 高于阈值,并不是所有的事务,包含牛奶 也包含金枪鱼
这种低规则往往是无趣的
(c)一个规则,低的支持和信心不足
答:食用油−→洗衣粉
如此低的信心规则 往往是无趣的
(d)规则,低支持和高的信心
答:伏特加−→鱼子酱
这样的规则往往是有趣的 2
考虑到数据集显示于表格6
(一)计算支持项集{ e },{ b、d },{ b、d、e }通过治疗 每个事务ID作为一个市场购物篮
答: (b) Use the results in part (a) to compute the confidence for the association rules {b, d} −→ {e} and {e} −→ {b, d}
Is confidence a symmetric measure
c、重复部分(一)通过将每个客户 ID 作为一个市场购物篮
每个 项目应被视为一个二进制变量(1 如果一个项目出现在 至少有一个交易购买的顾客,和 0 否则
) d e 没有明显关系 s 1,s 2,c 1 和 c 2 所以 c 2 有最低的置信度 4 、 因 为 年 代 (A,B,C)≤ 年 代 (A,B) 和 max(s( 一 个 ),s(B),s(C))≥ max(s( 一 个 ),s(B)), 因 此 ζ ({ A 、B })≥ ζ ({ A,B,C })
(b) 因为s(A,B,C)≤s(A,B)和最小(s(A,B),s(A,C),s(B,C))≤min(