第九章因子分析第九章因子分析事物的表现是多方面的,事物之间的相互作用也是交叉重叠和具有层次性的,所以我们期望对事物进行准确描述的时候总会陷入一种两难:一方面,对事物的各种表现的观测越全面,对事物的认识就越准确和越完整;另一方面,对事物的观测越全面,得到的描述变量就越多,对事物的特性的表述却变得更加困难了!显然,事物是普遍联系的,在高维度空间中描述事物比在低维度的空间中描述事物更客观,却更困难。这一矛盾如何解决呢?统计学提供了最有效的方法和手段,即因子分析:它首先在广泛的范围内搜集资料,得到尽可能全面的高维度数据资料,然后用因子分析进行降维处理,用较少的维度整合资料,获得对事物全面、准确而又便利的描述。一、因子分析的基本概念和原理通常,在科学研究中首先得到的观测资料都是关于事物的外在特征或个别的具体特征,这些特征的观测值存在聚合趋势,有倾向于聚合的一些变量具有高度相关性,这种高度的相关性显示出这些变量的背后存在着一个共同的制约因素,称为共同因子或因子。如果能够在一批多维数据资料中找到的m个共同因子可以解释各个变量的大部分变异,就可以使用这较少的m个因子描述原来很多变量才能描述的事物的属性。所以,将因子分析定义为:因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计方法。假如从p个变量的数据文件进行因子分析得到m个共同因子,那么m个共同因子的变化可以解释各个变量的大部分变异,换句话说,用这m个因子可以在相当程度上预测每一个变量的变化。于是得到下列回归方程组:该方程组表示了得到m个公共因子后,就可以使用这些公共因子在一定程度上预测每一个观测变量。方程中的系数正好是相对应的观测变量与公共因子的相关系数,也叫做该观测变量在对应因子上的载荷,即因子载荷,它反映了二者的关系强度。几个重要概念:1.因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因子对相应原变量的贡献力大小。1.因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因子对相应原变量的贡献力大小。2.变量共同度:对某一个原变量来说,其在所有因子上的载荷的平方和就叫做该变量的共同度。它反映了所有公共因子对该原变量的方差(变异)的解释程度。如果因子分析结果中大部分变量的共同度都高于0.8,说明提取的公共因子已经基本反映了原变量80%以上的信息,因子分析效果较好。变量共同度是衡量因子分析效果的常用指标。2.变量共同度:对某一个原变量来说,其在所有因子上的载荷的平方和就叫做该变量的共同度。它反映了所有公共因子对该原变量的方差(变异)的解释程度。如果因子分析结果中大部分变量的共同度都高于0.8,说明提取的公共因子已经基本反映了原变量80%以上的信息,因子分析效果较好。变量共同度是衡量因子分析效果的常用指标。3.公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和,它反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。3.公共因子的方差贡献:是某公共因子对所有原变量载荷的平方和,它反映该公共因子对所有原始总变异的解释能力,等于因子载荷矩阵中某一列载荷的平方和。一个因子的方差贡献越大,说明该因子就越重要。二、因子分析的基本步骤1.因子分析适合度检验确定原有若干变量是否适合于做因子分析的基本依据是原有变量的相关矩阵。如果相关矩阵中的相关系数大都小于0.3,而且未达到显著性水平,则说明变量间的相关性普遍较低,它们存在潜在共同因子的可能性较小,就不再适合于做因子分析;如果相关系数都比较大,则可以进行因子分析。在相关基础上可计算三个用于判断因子分析适合度的指标:巴特利特球形检验(BartlettTestofSphericity);反像相关矩阵检验(Anti-imagecorrelationmatrix);KMO(Kaiser-Meyer-Olkin)检验。确定原有若干变量是否适合于做因子分析的基本依据是原有变量的相关矩阵。如果相关矩阵中的相关系数大都小于0.3,而且未达到显著性水平,则说明变量间的相关性普遍较低,它们存在潜在共...