©1994-2010ChinaAcademicJournalElectronicPublishingHouse
Allrightsreserved
http://www
net计算机与现代化2007年第9期JISUANJIYUXIANDAIHUA总第145期文章编号:100622475(2007)0920012203收稿日期:2006209204作者简介:黄颖(19812),女,江西万载人,江西理工大学信息工程学院硕士研究生,研究方向:数据仓库与数据挖掘;李伟(19802),男,江西赣州人,讲师,硕士研究生,研究方向:遗传算法,演化硬件
EM算法与K2Means算法比较黄颖,李伟(江西理工大学信息工程学院,江西赣州341000)摘要:聚类是广泛应用的基本数据挖掘方法之一,它按照数据的相似性和差异性将数据分为若干簇,并使得同簇的尽量相似,不同簇的尽量相异
目前存在大量的聚类算法,本文仅考察了划分方法中的两个常用算法:EM算法和K2Means算法,并重点剖析了EM算法,对实验结果进行了分析
最后对算法进行了总结与讨论
关键词:聚类;K2Means算法;EM算法中图分类号:TP301
6文献标识码:AComparisonofEMandK2MeansAlgorithmsHUANGYing,LIWei(FacultyofInformationEngineering,JiangxiUniversityofScienceandTechnology,Ganzhou341000,China)Abstract:Clusteringisoneofbasicdataminingforms,itdividesdatatomanyclustersaccordingtothesimilarityanddissimilari2tybetweenthedata
Andthedatainoneclu