《数据挖掘》Weka实验报告姓名_学号_指导教师开课学期2015至2016学年2学期完成日期2015年6月12日
实验目的基于http://archive.ics.uci
edu/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori-ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行对比实验,并画出性能比较图训练并测试
实验环境实验采用Weka平台,数据使用来自http://archive.ics.uci
edu/ml/Datasets/Br-east+Cancer+WiscOnsin+%28Original%29,主要使用其中的BreastCancerWisc-onsin(Original)DataSet数据
Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发
Weka使用Java写成的,并且限制在GNU通用公共证书的条件下发布
它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件
Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果
3.实验步骤3
1数据预处理本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Samplecodenumber(样本代码),ClumpThickness(丛厚度),UniformityofCellSize(均匀的细胞大小),UniformityofCellShape(均匀的细胞形状),MarginalAdhesion(边际粘连),SingleEpithelialCellSize(单一的上皮细胞大小),BareNuclei(裸核),BlandChroma