数据挖掘—实用机器学习技术及Java实现原书–英文版《DataMining—PracticalMachineLearningToolsandTechniqueswithJavaImplementations》,新西兰IanH
Witten、EibeFrank著Weka–AnopensourceframeworkfortextanalysisimplementedinJavathatisbeingdevelopedattheUniversityofWaikatoinNewZealand
–http://www
waikato
nz/ml/weka/–http://www
com/datamining/概念:KDD、ML、OLAP与DMKDD(KnowledgeDiscoveryinDatabase)是一种知识发现的一连串过程
ML(MachineLearning)=KD,不限于Database的数据过程:挖掘-数据模式-表示-验证-预测OLAP(OnlineAnalyticalProcess)是数据库在线分析过程
数据挖掘(dataMining)只是KDD/ML的一个重要组成部分
DM用在产生假设,而OLAP则用于查证假设概念:DM与DBDataPreparation要占Datamining过程70%工作量「Database」+「Datamining」=会说话的数据库概念:DataMining概念:数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程–KeyCharacteristicsofDataMining:•Largeamountofdata•Discoveringpreviouslyunknown,hiddeninformation•Extractingvaluableinformation•Makingim