数据挖掘与数据仓库 数据挖掘试验报告一 姓名: 学号: 班级: 试验目的: 通过使用SPSS Clementine 数据挖掘平台,了解数据挖掘的目的、过程,理解数据挖掘的结果,并能够根据所学习的数据挖掘的相关知识,对挖掘的过程参数和结果数据进行分析。 试验内容: 建立数据源,进行关联规则挖掘。 试验步骤: 1. 打开Clementine11 软件 a)从“开始”菜单中,单击“所有程序” b)在“SPSS Clementine11.1”选择“SPSS Clementine Client 11.1” 2. 转换数据test.csv 为 testuse.csv 以便进行关联分析。 数据挖掘与数据仓库 3. 导入数据源 a)选择“可变文件”节点,把节点图标拖入数据流区域 b)右键点击“可变文件”节点,弹出节点细节选择界面 c)单击“brow ser for file”按钮,选择“testuse.csv”文件,点击“打开”按钮。 d)单击“确定”按钮 e)节点自动改名字为“testuse.csv” 4. 查看导入的数据 a)点击节点选项卡“输出”,双击“表格”节点 b)右键点击“testuse.csv”节点,选择“Connect”选项,单击“Table”(在两个节点中产生一个箭头,从“testuse.csv”指向“Table”节点。) 数据挖掘与数据仓库 c)右键点击“表格”节点,弹出细节选择界面,单击“执行” d)查看结束,单击“确定”退出查看表格 5. 对数据进行清洗 a)选择节点选项卡的“字段选项”,把“类型”节点拖入数据流区域。 b)连接“testu se.csv ”节点和“类型”节点 c)双击数据流区域中的“类型”节点,单击“读取值”按钮 d)把其他行的“方向”的值改为 “双向” 6. 使用Apriori 节点分析 a)双击“建模”选项卡的“Apriori”节点 b)连接“类型”节点与“Apriori”节点 (箭头指向“Apriori”节点) 数据挖掘与数据仓库 c)双击“Apriori”节点,弹出选项界面 d)单击Ex ecu te 按钮 7. 查看挖掘结果 a)左键单击管理器的“模型”选项卡,右键点击第 5 部执行以后出现的模型图标 b)选择“浏览”,弹出图表 c)查看结果 质合比 3:3 和奇偶 奇偶比 3:3 8. 提升 a)双击“Apriori”节点,弹出选项界面,修改参数 b)选择“模型”选项卡修改参数 100% 数据挖掘与数据仓库 c)修改“最低规则置信度”为 50(或者修改“最低条件支持度”和“最大前项数”) d)查看结果 质合比 1:5 和奇偶 和大小 奇偶比 1:5 关联规则分析 方法 原理 算法 优点 缺点 适用范围 逐层搜索的迭代算法,k-项...