聚类分析模型VIP免费

下载本文档

阅读 81
下载 11
格式 ppt
大小 367 KB
约18页
2024-10-19 发布于江苏
收藏
评论
点赞(0)
海报
举报

1/18页

2/18页

3/18页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/18

文本预览下载提示常见问题

聚类分析模型聚类分析研究一组多维样品的分类问题。但在分类之前，对类的个数、类的属性并不清楚，只是希望通过样品间的相似、相近或相互关系的密切程度等较为模糊的概念将它们加以适当的归类。首先需要引入一个适当的规则来度量样品间的相似、相近或相关的程度。“距离”是一个合适的选择。但这里的“距离”并不局限于传统意义上的欧氏距离，只要能在一定意义上刻划出样品间的相似、相近或相互关系密切程度的量都可称为距离，因此距离的定义有很大的灵活性。下面的三条原则是任何一种合理的距离定义应满足的：用YXd,表示按某种方式定义的样品X与Y间的距离，则1非负性0,YXd且YXYXd0,2对称性XYdYXd,,3三角不等式：对任意三个样品X、Y、Z，有ZYdYXdZXd,,,有时为了某种特殊的需要而定义的距离可能不满足上面的三角不等式，特称为广义距离，在聚类分析中也会用到。常用的距离有以下几种：设pxxX,,1，pyyY,,1是两个p维样品，1绝对距离piiiyxYXd1,2欧氏距离2112,piiiyxYXd3契比雪夫距离iipiyxYXd1max,4闵可夫斯基距离qpiqiiyxYXd11,，0q5马氏距离211,YXYXYXd，其中是所有样品的样本协差阵。6兰氏(Lance---William)距离piiiiiyxyxpYXd11,，（适用于样品各分量皆非负的情形）在对一个实际分类问题选定了一种最能刻划样品间相似、相近程度的距离（也称分类统计量）以后，接下来就是制定分类规则。系统聚类法的基本思想是：先将n个样品各自看成一类，共有n个类。然后计算类与类间的距离，选择距离最小的两类合并成一个新类，使总类数减少为1n。接着再计算这1n类两两间的距离，从中找出距离最近的两类合并，总类数又减少一个，剩下2n个类。照此下去，每合并一次，减少一类，直至所以样品都合并成一类为止。当然将全部样品合并成一类并不是我们的目的，我们的目的在于，通过上述逐渐并类的过程，我们有可能找到最佳的分类方案。具体讲，通过上述并类过程，我们可以根据聚类的先后以及并类时两类间的距离，画出能直观反映各样品间相近和疏远程度的聚类图（也称谱系图）。根据这张聚类图有可能找到最合适的分类方案。为了实现上述思想，还要考虑类与类间的距离如何定义。在上述聚类过程的第一步，由于每一类中的样品都只有一个，因此可以用样品间的距离来定义类间的距离。可是第一次并类以后，某些类中所包含的样品数将多于一个，在这种情况下，如何合理的定义类间的距离就是一个必须解决的问题。事实上，用不同的方式定义类间的距离就随之产生了不同的系统聚类法。在符号上，用ijd表样品iX与jX间的距离，用pqD表示类pG与qG间的距离。在样品间的距离选定以后，类与类间距离的定义又有多种选择。常用的有：1．最短距离法ijGxGxpqdDqjpiminˆ，即将类与类间的距离定义为两类中最近样品间的距离。pGqG2．最长距离法ijGxGxpqdDqjpimaxˆ，即将类与类间的距离定义为两类间最远样品间的距离。pGqG3．中间距离法中间距离法定义两类间的距离既不采用两类间的最短距离，也不采用两类间的最长距离，而是取介于两者之间的某种距离，它是通过递推的方式定义的。设三个类kG、pG、qG间的距离分别为kqD、pqD、kpD。在将pG、qG合并为一个新类rG以后，kG与rG间的距离krD既不取kpD也不取kqD，而是取以kqD、kpD、pqD为边长的三角形中，长为pqD的边的中线长作为kG与rG间的距离，如图所示容易计算得222412121ˆpqkpkqkrDDDDkGrGpGqGkqDkpDpqDkrD4.重心法每一类都有一个重心（即该类样品的均值点），将类与类间的距离定义为它们重心间的距离。记pG、qG的重心分别为px、qx则qpxxpqdD,ˆ4．类平均法将两类距离的平方定义为两类中的样品两两间距离平方的均值，即piqjGxGxijqppqdNND221其中pN、qN分别表示类pG、qG中样品的个数。在合理地选定（或定义）样品间的距离以后，再适当定义类间的距离，就确定了一种聚类规则，接下来就可以按照系统聚...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

聚类分析模型

聚类分析模型聚类分析研究一组多维样品的分类问题

但在分类之前，对类的个数、类的属性并不清楚，只是希望通过样品间的相似、相近或相互关系的密切程度等较为模糊的概念将它们加以适当的归类

首先需要引入一个适当的规则来度量样品间的相似、相近或相关的程度

“距离”是一个合适的选择

但这里的“距离”并不局限于传统意义上的欧氏距离，只要能在一定意义上刻划出样品间的相似、相近或相互关系密切程度的量都可称为距离，因此距离的定义有很大的灵活性

下面的三条原则是任何一种合理的距离定义应满足的：用YXd,表示按某种方式定义的样品X与Y间的距离，则1非负性0,YXd且YXYXd0,2对称性XYdYXd,,3三角不等式：对任意三个样品X、Y、Z，有ZYdYXdZXd,,,有时为了某种特殊的需要而定义的距离可能不满足上面的三角不等式，特称为广义距离，在聚类分析中也会用到

常用的距离有以下几种：设pxxX,,1，pyyY,,1是两个p维样品，1绝对距离piiiyxYXd1,2欧氏距离2112,piiiyxYXd3契比雪夫距离iipiyxYXd1max,4闵可夫斯基距离qpiqiiyxYXd11,，0q5马氏距离211,YXYXYXd，其中是所有样品的样本协差阵

6兰氏(Lance---William)距离piiiiiyxyxpYXd11,，（适用于样品各分量皆非负的情形）在对一个实际分类问题选定了一种最能刻划样品间相似、相近程度的距离（也称分类统计量）以后，接下来就是制定分类规则

系统聚类法的基本思想是：先将n个样品各自看成一类，共有n个类

然后计算类与类间的距离，选择距离最小的两类合并成一个

您可能关注的文档

读万卷书 + 关注: 实名认证
内容提供者

各类经典PPT文档分享

收藏店铺进入空间

聚类分析模型VIP免费

聚类分析模型

您可能关注的文档

相关文档

热门下载

相关标签