完整word版-AP近邻传播聚类算法原理及Matlab实现

下载本文档

阅读 146
下载 23
格式 doc
大小 268.5 KB
约5页
2025-09-04 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/5页

2/5页

3/5页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

AP 近邻传播聚类算法原理及 Matlab 实现Affinity Propagation (AP)聚类是 2025 年在 Science 杂志上提出的一种新的聚类算法。它根据 N 个数据点之间的相似度进行聚类，这些相似度可以是对称的，即两个数据点互相之间的相似度一样(如欧氏距离);也可以是不对称的，即两个数据点互相之间的相似度不等。这些相似度组成 N×N 的相似度矩阵 S(其中 N为有 N 个数据点)。AP 算法不需要事先指定聚类数目，相反它将所有的数据点都作为潜在的聚类中心，称之为exemplar。以 S 矩阵的对角线上的数值 s(k, k)作为 k 点能否成为聚类中心的评判标准，这意味着该值越大，这个点成为聚类中心的可能性也就越大，这个值又称作参考度 p( preference)。聚类的数量受到参考度 p 的影响，假如认为每个数据点都有可能作为聚类中心，那么 p 就应取相同的值。假如取输入的相似度的均值作为 p 的值，得到聚类数量是中等的。假如取最小值，得到类数较少的聚类。AP 算法中传递两种类型的消息，(responsiility)和(availability)。r(i,k)表示从点 i 发送到候选聚类中心 k的数值消息，反映 k 点是否适合作为 i 点的聚类中心。a(i,k)则从候选聚类中心 k 发送到 i 的数值消息，反映 i 点是否选择 k 作为其聚类中心。r(i, k)与 a (i, k)越强，则 k 点作为聚类中心的可能性就越大，并且 i 点隶属于以 k 点为聚类中心的聚类的可能性也越大。AP 算法通过迭代过程不断更新每一个点的吸引度和归属度值，直到产生 m 个高质量的 exemplar，同时将其余的数据点分配到相应的聚类中。在这里介绍几个文中常出现的名词：exemplar：指的是聚类中心。similarity：数据点 i 和点 j 的相似度记为 S(i，j)。是指点 j 作为点 i 的聚类中心的相似度。preference：数据点 i 的参考度称为 P(i)或 S(i,i)。是指点 i 作为聚类中心的参考度。一般取 S 相似度值的中值。Responsibility：R(i,k)用来描述点 k 适合作为数据点 i 的聚类中心的程度。Availability：A(i,k)用来描述点 i 选择点 k 作为其聚类中心的适合程度。Damping factor：阻尼系数，主要是起收敛作用的。机器学习中一个很重要的方面就是聚类算法。聚类算法说白了就是给你一大堆点的坐标（维度可以是很高的），然后给你一个距离度量的准则（比如欧拉距离，马氏距离什么的），然后你要自动把相近的点放在一个集合里面，归为一类。继续科普：一个比较传统的聚...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

完整word版-AP近邻传播聚类算法原理及Matlab实现

AP 近邻传播聚类算法原理及 Matlab 实现Affinity Propagation (AP)聚类是 2025 年在 Science 杂志上提出的一种新的聚类算法

它根据 N 个数据点之间的相似度进行聚类，这些相似度可以是对称的，即两个数据点互相之间的相似度一样(如欧氏距离);也可以是不对称的，即两个数据点互相之间的相似度不等

这些相似度组成 N×N 的相似度矩阵 S(其中 N为有 N 个数据点)

AP 算法不需要事先指定聚类数目，相反它将所有的数据点都作为潜在的聚类中心，称之为exemplar

以 S 矩阵的对角线上的数值 s(k, k)作为 k 点能否成为聚类中心的评判标准，这意味着该值越大，这个点成为聚类中心的可能性也就越大，这个值又称作参考度 p( preference)

聚类的数量受到参考度 p 的影响，假如认为每个数据点都有可能作为聚类中心，那么 p 就应取相同的值

假如取输入的相似度的均值作为 p 的值，得到聚类数量是中等的

假如取最小值，得到类数较少的聚类

AP 算法中传递两种类型的消息，(responsiility)和(availability)

r(i,k)表示从点 i 发送到候选聚类中心 k的数值消息，反映 k 点是否适合作为 i 点的聚类中心

a(i,k)则从候选聚类中心 k 发送到 i 的数值消息，反映 i 点是否选择 k 作为其聚类中心

r(i, k)与 a (i, k)越强，则 k 点作为聚类中心的可能性就越大，并且 i 点隶属于以 k 点为聚类中心的聚类的可能性也越大

AP 算法通过迭代过程不断更新每一个点的吸引度和归属度值，直到产生 m 个高质量的 exemplar，同时将其余的数据点分配到相应的聚类中

在这里介绍几个文中常出现的名词：exemplar：指的是聚类中心

similarity：数据点 i 和点 j 的相似度记为 S(i，j

阳光书坊 + 关注: 实名认证
内容提供者

阳光书坊，传播未来

收藏店铺进入空间

完整word版-AP近邻传播聚类算法原理及Matlab实现

完整word版-AP近邻传播聚类算法原理及Matlab实现

您可能关注的文档

相关文档

热门下载

相关标签