实验2 K均值聚类算法 2.1 实验目的 将模式识别方法与图像处理技术相结合,掌握利用K 均值聚类算法进行图像分类的基本方法,通过实验加深对基本概念的理解。 2.2 实验仪器设备及软件 HP D538、MATLAB、W IT 2.3 实验原理 K 均值聚类法分为如下几个步骤: 一、初始化聚类中心 1、凭经验选择。根据具体问题,凭经验从样本集中选出 K 个比较合适的样本作为初始聚类中心。 2、用前 K 个样本作为初始聚类中心。 3、将全部样本随机地分成 K 类,计算每类的样本均值,将样本均值作为初始聚类中心。 4、密度法。以每个样本为球心,用某个正数为半径作一个球形邻域,落在邻域内的样本数为该点密度,选密度最大点为第一初始聚类中心。在离开第一点规定距离范围外确定次大密度点,以避免初始聚类中心聚集。 5、从1K 个聚类划分的解中产生 K 个聚类划分的初始聚类中心。先把全部样本看作一个聚类,其聚类中心为样本的总均值;然后确定两聚类问题的聚类中心是一聚类问题的总均值和离它最远的点;以此类推。 二、初始聚类 1、按就近原则将样本归入各聚类中心所代表的类中。 2、取一样本,将其归入与其最近的聚类中心的那一类中,重新计算样本均值,更新聚类中心。然后取下一样本,重复操作,直至所有样本归入相应类中。 三、判断聚类是否合理 采用误差平方和准则函数判断聚类是否合理,不合理则修改分类。循环进行判断、修改直至达到算法终止条件。 2.4 实验步骤及程序 clc clear tic img= imread ('C:\Documents and Settings\Administrator\桌面、模式实验cc\lena.bmp'); %?????? [m,n]=size(img); subplot(2,2,1),imshow(img);title('原图') subplot(2,2,2),imhist(img);title('直方图') hold off; img=double(img); for i=1:200 c1(1)=25; c2(1)=125; c3(1)=200; r=abs(img-c1(i)); g=abs(img-c2(i)); b=abs(img-c3(i)); r_g=r-g; g_b=g-b; r_b=r-b; n_r=find(r_g<=0&r_b<=0); n_g=find(r_g>0&g_b<=0); n_b=find(g_b>0&r_b>0); i=i+1; c1(i)=sum(img(n_r))/length(n_r); c2(i)=sum(img(n_g))/length(n_g); c3(i)=sum(img(n_b))/length(n_b); d1(i)=abs(c1(i)-c1(i-1)); d2(i)=abs(c2(i)-c2(i-1)); d3(i)=abs(c3(i)-c3(i-1)); if d1(i)<=0.001&&d2(i)<=0.001&&d3(i)<=0.001 R=c1(i); G=c2(i); B=c3(i); k=i; break; end end R G B img=uint8(img); img(find(imgR&imgG))=255; toc subplot(2,2,3),imshow(img);title('K¾ùÖµ¾ÛÀàËã·¨ ') subplot(2,2,4),imhist(img);title(' Ö±·½Í¼') 2.5 实验结果与分析 R = 68.3649 G = 129.3456 B = 181.5449 Elapsed time is 2.270985 seconds.