电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

原创WEKA对UCI乳腺癌数据数据挖掘试验报告附代码数据VIP免费

原创WEKA对UCI乳腺癌数据数据挖掘试验报告附代码数据_第1页
1/4
原创WEKA对UCI乳腺癌数据数据挖掘试验报告附代码数据_第2页
2/4
原创WEKA对UCI乳腺癌数据数据挖掘试验报告附代码数据_第3页
3/4
【原创】WEKA对 UCI 乳腺癌数据数据挖掘实验报告 ( 附代码数据 ) 【原创】定制撰写数据分析可视化项目案例调研报告有问题到淘宝找“大数据部落”就可以了WEKA 对 wisconsin-breast-cancer数据挖掘分析报告一、 数据集实验采用 UCI 数据集中的Wisconsin医学院的William 博士提供的乳腺癌的数据样本。所有数据来自真实临床案例,每个案例有10 个属性。其中前九个属性是检测指标,每个属性值用1 到 10 的整数表示, 1 表示检测指标最正常,10 表示最不正常。 第十个属性是分类属性,指示该肿瘤是否为恶性。数据集中的肿瘤性质是通过活检得出的结果。肿块厚度Clump_Thickness integer [1,10] 细胞大小的均匀性Cell_Size_Uniformity integer [1,10] 细 胞 形 状 的 均 匀 性Cell_Shape_Uniformity integer [1,10] 边缘粘性Marginal_Adhesion integer [1,10] 单 上 皮 细 胞 的 大 小Single_Epi_Cell_Size integer [1,10] 裸核Bare_Nuclei integer [1,10] 乏味染色体Bland_Chromatin integer [1,10] 正常核Normal_Nucleoli integer [1,10] 有丝分裂Mitoses integer [1,10] 肿瘤性质Class { benign, malignant} 该数据集共有669 个实例。本次实验对以上数据集进行了分类、聚类、关联规则三部分操作,以熟悉weka 软件的操作使用,并尝试挖掘数据中的实际价值。分类中,尝试用前九个属性值来预测肿瘤的性质;聚类中,寻找各个簇病人的显著特征,可用来辅助制定针对性治疗计划;关联规则的探索,寻找不同属性值之间的相关性。二、 分类1. 数据预处理将 wisconsin-breast-cancer数据集分割为两个,分别作为 trainset和 testset。2. 实验过程用 j48 分类树对 trainset进行分类运算,结果如下:1 / 5 【原创】定制撰写数据分析可视化项目案例调研报告有问题到淘宝找“大数据部落”就可以了结果表明,模型分类的准确率达到了96%。 Confusion Matrix表明有 13 例良性肿瘤被错位的归类为恶性;有6 例恶性肿瘤被错误的归类为良性。将以上模型应用于testset以检验预测准确率,运行结果如下:结果表明,预测准确率达到了99%。Confusion Matrix表示有 2 例良性肿瘤被错误的归类为恶性;而恶性肿瘤均被正确分类。3. 结果分析首先,通过检验,j48方法通过训练集生成的决策树对肿瘤性质的预测准确率可以稳定在较高水平,因此可以将此模型用于临床诊断。这对于因医疗条件不佳而不...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

原创WEKA对UCI乳腺癌数据数据挖掘试验报告附代码数据

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部