1 第三章聚类分析一、填空题1. 在进行聚类分析时, 根据变量取值的不同, 变量特性的测量尺度有以下三种类型:间隔尺度、顺序尺度和名义尺度。2.Q型聚类法是按 ___样品 ___进行聚类, R型聚类法是按 _变量___进行聚类。3.Q型聚类统计量是 ____距离 _,而 R型聚类统计量通常采用 _相似系数 ____。4.在聚类分析中,为了使不同量纲、不同取值范围的数据能够放在一起进行比较,通常需要对原始数据进行变换处理。常用的变换方法有以下几种: __中心化变换 _____、__标准化变换 ____、____规格化变换 __、__ 对数变换 _ 。5.距离ijd 一般应满足以下四个条件:对于一切的i,j,有0ijd、ji时,有0ijd、对于一切的 i,j,有jiijdd、对于一切的 i,j,k,有kjikijddd。6. 相似系数一般应满足的条件为:若变量ix 与jx 成比例,则1ijC、对一切的 i,j,有1ijC和对一切的 i,j,有jiijCC。7. 常用的相似系数有夹角余弦和相关系数两种。8. 常用的系统聚类方法主要有以下八种:最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法。9.快速聚类在 SPSS中由 __K-mean_____________过程实现。10. 常用的明氏距离公式为:qpkqjkikijxxqd11,当1q时,它表示绝对距离;当2q时,它表示欧氏距离;当 q 趋于无穷时,它表示切比雪夫距离。11.聚类分析是将一批样品或变量,按照它们在性质上的亲疏、相似程度进行分类。12.明氏距离的缺点主要表现在两个方面:第一明氏距离的值与各指标的量纲有关,第二 明氏距离没有考虑到各个指标(变量)之间的相关性。13.马氏距离又称为广义的欧氏距离。14,设总体 G 为 p 维总体,均值向量为p,,,=21,协差阵为,则样品pXXXX,,,21与总体G的马氏距离定义为2 XXGXd12,。15.使用离差平方和法聚类时,计算样品间的距离必须采用欧氏距离。16.在 SPSS中,系统默认定系统聚类方法是类平均法。17.在系统聚类方法中,中间距离法和重心法不具有单调性。18.离差平方和法的基本思想来源于方差分析。19.最优分割法的基本步骤主要有三个:第一,定义类的直径;第二,定义目标函数;第三,求最优分割。20.最优分割法的基本思想是基于方差分析的思想。二、判断题1. 在对数据行进中心化变换之后,数据的均值为0,而协差阵不变,且变换后后的数据与变量的量纲无关。()2.根据分类的原理, 我们可以把聚类分为样品聚类和变量聚类。()3.兰氏距离不仅克服...