第二章均值向量和协方差阵的检验1、 试谈 willks统计量在多元方差分析中的重要意义
2、 形象分析的基本思路是什么
形象又称轮廓图, 是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点
形象分析是将两(多)总体的形象绘制到同一个坐标下,根据形象(轮廓图)的形状对总体的均值进行比较分析
第三章聚类分析1、聚类分析的基本思想和功能是什么
聚类分析的 核心思想 是根据具体的指标(变量) 对所研究的个体或者对象进行分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强
聚类分析不仅可以用来对样品进行分类, 也可以用来对变量进行分类
对样品的分类常称为Q型聚类分析, 对变量的分类常称为 R型的聚类分析
聚类分析的 目的或功能 就是把相似的研究对象归成类,即使类间对象的同质性最大化和类与类间对象的异质性最大化
2、试述系统聚类法的原理和具体步骤(1)系统聚类的 基本思想 是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中
(2)系统聚类的 具体步骤 :假设总共有N个样品(或变量)第一步:将每个样品(或变量)独自聚成一类,共有N类;第二步:根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成N-1 类;第三步:将“距离”最近的两个类进一步聚成一类,共聚成N-2 类;
,以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类
3、试述 K-均值聚类的方法原理这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中
首先随机从数据集中选取 K 个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类
计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两