甘肃政法学院 本科生实验报告 (2) 姓名: 学院:计算机科学学院 专业:信息管理与信息系统 班级: 实验课程名称:数据挖掘 实验日期: 指导教师及职称: 实验成绩: 开课时间:2013—2014 学年 一 学期 甘肃政法学院实验管理中心印制 实验题目 Weka 的数据聚类分析 小组合作 姓名 班级 学 号 一、实验目的 1、了解和熟悉K 均值聚类的步骤 2、利用Weka 中提供的simpleKmeans 方法对数据文件进行聚类分析,更深刻的理解k 均值算法,并通过对实验结果进行观察分析,找出实验中所存在的问题
二.实验环境 Win 7环境下的 Eclipse 三、实验内容 在 WEKA 中实现K 均值的算法,观察实验结果并进行分析
四、 实验过程与分析 一、实验过程 1 、添加数据文件 打开Weka的Explore,使用Open file点击打开本次实验所要使用的raff格式数据文件“auto93
raff” 2 、选择算法类型 点击Cluster中的Choose,选择本次实验所要使用的算法类型“SimpleKMeans” 3 、得出实验结果 选中“Cluster Mode ”的“Use training set”,点击“Start”按钮,观察右边“Clusterer output”给出的聚类结果如下: === Run information === Scheme: weka
clusterers
SimpleKMeans -N 2 -S 10 Relation: auto93
names Instances: 93 Attributes: 23 Manufacturer Type City_MPG Highway_MPG Air_Bags_standard Drive_train_type Number_of_cylinders Engine_size Horsep