20241228年月日1第九章SPSS的聚类分析20241228年月日29
1聚类分析的一般问题9
1聚类分析的意义聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法
聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果
类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大
20241228年月日3例如,学校里有些同学经常在一起,关系比较密切,而他们与另一些同学却很少来往,关系比较疏远
究其原因可能会发现,经常在一起的同学的家庭情况、性格、学习成绩、课余爱好等方面有许多共同之处,而关系比较疏远的同学在这些方面有较大的差异性
为了研究家庭情况、性格、学习成绩、课余爱好等是否会成为划分学生小群体的主要决定因素,可以从有关这些方面的数据入手,进行客观分组,然后比较所得的分组是否与实际相吻合
对学生的客观分组就可采用聚类分析方法
20241228年月日49
2聚类分析中“亲疏程度”的度量方法1、定距型变量个体间距离的计算方式欧式距离(Euclideandistance)平方欧式距离(SquaredEuclideandistance)切比雪夫(Chebychev)距离Block距离明考斯基(Minkowski)距离夹角余弦(Cosine)距离用户自定义(Customized)距离20241228年月日52、计数变量个体间距离的计算方式卡方(Chi-Squaremeasure)距离Phi方(Phi-Squaremeasure)距离3、二值(Binary)变量个体间距离的计算方式简单匹配系数(SimpleMatching)雅科比系数(Jaccard)注:聚类分析的几点说明所选择的变量应符合聚类的要求各变量的变量值不应有数量级上的差异各变量间不应有较