关联分析SPSS例析

下载本文档

阅读 149
下载 29
格式 pdf
大小 652.94 KB
约9页
2024-12-22 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/9页

2/9页

3/9页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

关联分析（笔记）事物之间的关联关系包括：简单关联关系、序列关联关系。简单关联规则：属于无指导学习方法，不直接用于分类预测，只揭示事物内部的结构。 Spss modeler 提供了 APriori、GRI、Carma 等经典算法。APriori 和 Carma 属于同类算法。序列关联：关联具有前后顺序，通常与时间有关。 SPSS Modeler 提供了 sequence 算法；数据格式如下：按照事务表存储，同事需要时间变量。关联关系简单关联关系序列关联关系Apriori只能处理分类变量数据可以是按事务表存储，亦可事实表存储。算法为提高关联规则的产生效率而设计GRI不但可以处理分类变量，前项也可是数值变量数据只能按照事实表存储采用深度优先搜索策略实现算法简单关联规则要分析的对象是事务事务的储存方式有事务表和事实表两种方式。事务表顾客ID 项集 1 A 1 D 2 B 2 D 3 A 3 C 事实表顾客ID 项目A 项目B 项目C 项目D 1 1 0 0 1 2 0 1 0 1 3 1 0 1 0 两种表均表明，顾客1 购买了AD 两种物品，顾客2 购买了BD 两种物品，顾客三购买了AC 两种物品。关联规则有效性的测度指标 1、支持度su pport：所有购买记录中，A、B 同时被购买的比例。 2、置信度confidence：在购买A 的事务中，购买B 的比例。关联规则实用性的测度指标 1、提升度lift：（在购买A 的事务中，购买B 的比例）/（所有事务中，购买B 的比例） 2、置信差 3、置信率、正态卡方、信息差等等简单关联关系实例例 1 数据格式：事实表算法:Apriori 所有购买项目均选入前项antecedent 和后项consequent。输出结果的最低支持度是10%；本例设定的划分频繁项集的标准大于最小支持度10%。最小置信度是80%；前项最多项目数：5 本例中，三项以上没有超过10%的支持度，所以不能形成三项以上的频繁项集，最大的频繁项集大小是2。结论解释：实例：包含前项beer、cannedveg 的样本有167 个，在 1000 个样本中前项支持度为 16.7%。规则支持度：同时购买beer、cannedveg、frozenmeal 三项的支持度为 14.6%。规则置信度：购买beer、cannedveg 的客户中，87.425%的人有购买frozenmeal。规则 2 下，购买frozenmeal 的可能性比购买frozenmeal 的支持度提高 2.895 倍。例2 数据格式：事实表算法:Apriori 本例前项选择性别和家乡，旨在不同性别和地区客户的购买行为是否存在频繁项集。由于 ...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

关联分析SPSS例析

关联分析（笔记）事物之间的关联关系包括：简单关联关系、序列关联关系

简单关联规则：属于无指导学习方法，不直接用于分类预测，只揭示事物内部的结构

Spss modeler 提供了 APriori、GRI、Carma 等经典算法

APriori 和 Carma 属于同类算法

序列关联：关联具有前后顺序，通常与时间有关

SPSS Modeler 提供了 sequence 算法；数据格式如下：按照事务表存储，同事需要时间变量

关联关系简单关联关系序列关联关系Apriori只能处理分类变量数据可以是按事务表存储，亦可事实表存储

算法为提高关联规则的产生效率而设计GRI不但可以处理分类变量，前项也可是数值变量数据只能按照事实表存储采用深度优先搜索策略实现算法简单关联规则要分析的对象是事务事务的储存方式有事务表和事实表两种方式

事务表顾客ID 项集 1 A 1 D 2 B 2 D 3 A 3 C 事实表顾客ID 项目A 项目B 项目C 项目D 1 1 0 0 1 2 0 1 0 1 3 1 0 1 0 两种表均表明，顾客1 购买了AD 两种物品，顾客2 购买了BD 两种物品，顾客三购买了AC 两种物品

关联规则有效性的测度指标 1、支持度su pport：所有购买记录中，A、B 同时被购买的比例

2、置信度confidence：在购买A 的事务中，购买B 的比例

关联规则实用性的测度指标 1、提升度lift：（在购买A 的事务中，购买B 的比例）/（所有事务中，购买B 的比例） 2、置信差 3、置信率、正态卡方、信息差等等简单关联关系实例例 1 数据格式：事实表算法:Apriori 所有购买项目均选入前项antecedent 和后项consequent

输出结果的最低支持度是10%；本例设定的划分频繁项集的标准大于最小支持度10%

小辰4 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

关联分析SPSS例析

关联分析SPSS例析

您可能关注的文档

相关文档

热门下载

相关标签