基于 weka 得数据分类分析实验报告1实验基本内容本实验得基本内容就是通过使用 weka 中得三种常见分类与聚类方法(决策树 J4 8、KNN 与k—me a n s)分别在训练数据上训练出分类模型,并使用校验数据对各个模型进行测试与评价,找出各个模型最优得参数值,并对三个模型进行全面评价比较,得到一个最好得分类模型以及该模型所有设置得最优参数
最后使用这些参数以及训练集与校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测
2数据得准备及预处理2、1 格式转换方法(1)打开“d ata02、x ls” 另存为 CS V类型,得到“da ta0 2、csv”. (2)在 WEK A中提供了一个“Arff Vi e wer”模块,打开一个“data02、c s v"进行浏览,然后另存为 ARFF 文件,得到“d at a0 2、arf f”
3、 实验过程及结果截图3、1 决策树分类(1)决策树分类用“Ex p lo r e r"打开数据“data02、a rf f”,然后切换到“Clas s if y”.点击“Choose",选择算法“t re e s—J 4 8”,再在“Tes t op t ions"选择“Cr o ss-v alidati o n(F l od s=1 0)”,点击“St a rt”,开始运行
系统默认 tr e es—J 48决策树算法中 minNu mO bj=2,得到如下结果=== S ummary ===Cor r e c tly Cla s sifie d Inst a nces 23 88、4 6 1 5 %I ncor re ctl y Cla ss ified In s t a nces 3 11、5 3 85 %Kap p a stati sti c 0、7636M e a n abs ol ut e er r