电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

有关k-均值聚类算法理解VIP免费

有关k-均值聚类算法理解_第1页
1/7
有关k-均值聚类算法理解_第2页
2/7
有关k-均值聚类算法理解_第3页
3/7
**有关均值聚类算法的理解均值聚类算法的历史:聚类分析作为一种非监督学习方法,是机器学习领域中的一个重要的研究方向,同时,聚类技术也是数据挖掘中进行数据处理的重要分析工具和方法。年首次提出了均值聚类算法(算法)。到目前为止用于科学和工业应用的诸多聚类算法中一种极有影响的技术。它是聚类方法中一个基本的划分方法,常常采用误差平方和准则函数作为聚类准则函数迄今为止,很多聚类任务都选择该经典算法,算法虽然有能对大型数据集进行高效分类的优点,但算法必须事先确定类的数目,而实际应用过程中,值是很难确定的,并且初始聚类中心选择得不恰当会使算法迭代次数增加,并在获得一个局部最优值时终止,因此在实际应用中有一定的局限性。半监督学习是近年来机器学习领域的一个研究热点,已经出现了很多半监督学习算法,在很多实际应用中,获取大量的无标号样本非常容易,而获取有标签的样本通常需要出较大的代价。因而,相对大量的无标签样本,有标签的样本通常会很少。传统的监督学习只能利用少量的有标签样本学习,而无监督学习只利用无标签样本学习。半监督学习的优越性则体现在能同时利用有标签样本和无标签样本学习。针对这种情况,引入半监督学习的思想,对部分已知分类样本运**用图论知识迭代确定算法的值和初始聚类中心,然后在全体样本集上进行均值聚类算法。算法在遥感多光谱分类中的应用基于均值聚类的多光谱分类算法近年来对高光谱与多光谱进行分类去混的研究方法很多,均值聚类算法与光谱相似度计算算法都属于成熟的分类算法这类算法的聚类原则是以数据的均值作为对象集的聚类中心。均值体现的是数据集的整体特征,而掩盖了数据本身的特性。无论是对高光谱还是对多光谱进行分类的方法很多,均值算法属于聚类方法中一种成熟的方法。使用将多光谱图像合成一幅伪彩色图像见图,图中可以看出它由标有数字的背景与标有数字和的两种不同的气泡及标有数字的两个气泡重叠处构成。**1背景4气泡叠加22用进行分类,分类结果如图,背景被分成标有数字的红色与标有数字的绿色两类;一种气泡被分为两类,一类归为标有数字的绿色的背景类,一类为标有数字的蓝色的气泡类;另外一种气泡被分为标有数字的黄色与标有数字的浅蓝色两类。通过用均值()进行分类,算法对于两种气泡的分类效果都很好。2—种气232322344333223323另外一和气图原始图像**23342342225355244525434②002绿色3黄色图均值分类后的图像5浅蓝色算法的步骤:第一步:选个初始聚类中心,z1,Z1,AZ1,其中括号内的序号为12k寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定,例如可选开始的个模式样本的向量值作为初始聚类中心。第二步:逐个将需分类的模式样本按最小距离准则分配给个聚类中心中的某一个z(1)。对所有的工,…,如果jZ1,Z1,AZ1则,GSk其中为迭代运算的次序号,第一次迭代,S12kjj表示第个聚类,其聚类中心为Z。第三步:计算各个聚类中心的新的向量值Z(k+1),j各聚类域中所包含样本的均值向量:Z(k+1)=**工XXES(K)j其中N为第个聚类域S中所包含的样本个数。以均值向量作为新的jj聚类中心,可使如下聚类准则函数最小:J=迟工X—Z(k+1)jj=1XES(K)j在这一步中要分别计算个聚类中的样本均值向量,所以称之为均值算法。第四步:若Z(k+1)丰Z(k+1),…,则返回第二步,将模式jj样本逐个重新分类,重复迭代运算;若Z(k+1)=Z(k+1),…,jj则算法收敛,计算结束。均值聚类算法的优缺点:优点:算法的特点是:第一,能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类;第二,为克服少量样本聚类的不准确性,该算法本身具有优化迭代功能,在已经求得的聚类上再次进行迭代修正剪枝确定部分样本的聚类,优化了初始监督学习样本分类不合理的地方;第三,由于只是针对部分小样本可以降低总的聚类时间复杂度。缺点:①在算法中是事先给定的,这个值的选**定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适。这也是算法的一个不足。有的算法是通过类的自动合并和分裂,得到较为合理的类型数目,例如算法。关于算法中聚类数目值的...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

有关k-均值聚类算法理解

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部