标准文案中南民族大学计算机科学学院《数据挖掘与知识发现》综合实验报告姓名年级级专业软件工程指导教师李波学号序号31实验类型综合型成绩评定评语:教师签名:年月日标准文案2016年12月15日年级专业软件工程班级组号实验室9-205日期实验名称数据挖掘与知识发现实验内容分项内容实验级别Weka环境熟悉;决策树(1)决策树(2)关联规则,聚类分析KDD案例属性相关性,神经网络(1)神经网络(2)小组成员姓名学号组内分工自我评分教师评分标准文案实验分项1Weka环境熟悉;决策树(1)实验目的1
熟悉Weka软件的环境和基本用法
掌握ARFF数据文件的编制方法
学习应用Weka软件建立决策树的方法,并理解决策树的剪枝和未剪枝的分类效果
实验要求1、参照教材19-22页内容,熟悉页内容,熟悉WekaWekaWeka软件的安装及使用环境;2、在记事本程序中编制ColdTypetraining
arff,ColdTypetest
3、打开WekaWekaWeka软件,并参软件,并参照教材1
2,完成相关操作并小节,完成相关操作并小节,完成相关操作并小节,完成相关操作并理解相应处理结果
4、根据教材表2
1所提供的数据集T,基于WekaWekaWeka软件,应用C4
5算法建立决策树,预测某个学生是否决定去打篮球
要求:(1)采用arffarff文件来完成;文件来完成;(2)分别完成决策树剪枝和未的情况
实验原理步骤(算法流程)1.熟悉Weka软件的环境和基本用法并编写arff文件
(1)我们实验中Weka访问的数据格式是arff格式的
(2)运行Weka后,出现了窗口,我们在里面选择Explorer界面
(3)在Preprocess选项卡,点击file按钮,加载arff文件,就可以对文件中的数据进行采集挖掘
(4)用@data定义数据集的开始,数据值用逗号隔