Weka数据挖掘软件使用指南1
Weka简介该软件是WEKA的全名是怀卡托智能分析环境(WaikatoEnvironmentforKnowledgeAnalysis),它的源代码可通过http://www
waikato
nz/ml/weka得到
Weka作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化
如果想自己实现数据挖掘算法的话,可以看一看Weka的接口文档
在Weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情
Weka启动打开Weka主界面后会出现一个对话框,如图:主要使用右方的四个模块,说明如下:Explorer使用Weka探索数据的环境,包括获取关联项,分类预测,聚簇等;(本文主要总结这个部分的使用)Experimenter运行算法试验、管理算法方案之间的统计检验的环境;KnowledgeFlow这个环境本质上和Explorer所支持的功能是一样的,但是它有一个可以拖放的界面
它有一个优势,就是支持增量学习;SimpleCLI提供了一个简单的命令行界面,从而可以在没有自带命令行的操作系统中直接执行Weka命令;(某些情况下使用命令行功能更好一些)3.主要操作说明点击进入Explorer模块开始数据探索环境:3
1主界面进入Explorer模式后的主界面如下:3
1标签栏主界面最左上角(标题栏下方)的是标签栏,分为五个部分,功能依次是:1
Preprocess
选择和修改要处理的数据;2
Classify
训练和测试关于分类或回归的学习方案;3
Cluster
从数据中学习聚类;4
Associate
从数据中学习关联规则;5
Selectattributes
选择数据中最相关的属性;6
Visualiz