2007年第9期计算机与现代化JISUANJIYUXIANDAIHUA总第145期文章编号:】006-2475(2007)09.0012_03EM算法与K
Means算法比较黄颖,李伟(江西理工大学信息工程学院.江西赣州341000)摘要:聚类是广泛应用的基本数据挖掘方法之一.它按照数据的相似性和差异性特数据分为若干簇,并使得同簇的尽量相似,不同蔟的尽量相异
目前存在大量的聚类算法.本文但考察了划分方法中的两个常用算法:EM算法和K-MearIs算法,并重点剖析了EM算珐.对实验结果进行了分析
最后对算法进行了总结与讨论
关键词:最类;K—Me鲫s算法;EM算法中图分类号:仰3016文献标识码:AComparisonofEMandK-Mea啮Algoritl腑sHUANGYing,UWei(Facuhyof111⋯natmE“91眦e矗“g,Jia
嶝iuniversi‘yofscience阴dTechnology,Ganzllou341000,china)Abst强ct:Clustedng拓0neofb蚰icdataminingf0邢3,ildjvidesdatatoma“ycIu肚ersacc甜di工lgtotIlesiIIlil面可肌ddis8imil“-tybe¨een暗佗data.AI以theda吨inoneclu咖a工emo她siⅡm吐山an口山e毋.1herearem8卿clu卧e五“gdg瞄山瑚,恤epa”oIllyintroduc朗twDcoInmonclusted“gB190血hm8:EMalgo订thmandK-Mean8algodthm,emph艚izesEMa190dtIIln,arId8tlast,discussesthe耽81lltofthealgodthⅡ1anddrBwsaconclusion.Keyword5:cluste^”g:K-Me