第九章因子分析第九章因子分析事物的表现是多方面的,事物之间的相互作用也是交叉重叠和具有层次性的,所以我们期望对事物进行准确描述的时候总会陷入一种两难:一方面,对事物的各种表现的观测越全面,对事物的认识就越准确和越完整;另一方面,对事物的观测越全面,得到的描述变量就越多,对事物的特性的表述却变得更加困难了
显然,事物是普遍联系的,在高维度空间中描述事物比在低维度的空间中描述事物更客观,却更困难
这一矛盾如何解决呢
统计学提供了最有效的方法和手段,即因子分析:它首先在广泛的范围内搜集资料,得到尽可能全面的高维度数据资料,然后用因子分析进行降维处理,用较少的维度整合资料,获得对事物全面、准确而又便利的描述
一、因子分析的基本概念和原理通常,在科学研究中首先得到的观测资料都是关于事物的外在特征或个别的具体特征,这些特征的观测值存在聚合趋势,有倾向于聚合的一些变量具有高度相关性,这种高度的相关性显示出这些变量的背后存在着一个共同的制约因素,称为共同因子或因子
如果能够在一批多维数据资料中找到的m个共同因子可以解释各个变量的大部分变异,就可以使用这较少的m个因子描述原来很多变量才能描述的事物的属性
所以,将因子分析定义为:因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计方法
假如从p个变量的数据文件进行因子分析得到m个共同因子,那么m个共同因子的变化可以解释各个变量的大部分变异,换句话说,用这m个因子可以在相当程度上预测每一个变量的变化
于是得到下列回归方程组:该方程组表示了得到m个公共因子后,就可以使用这些公共因子在一定程度上预测每一个观测变量
方程中的系数正好是相对应的观测变量与公共因子的相关系数,也叫做该观测变量在对应因子上的载荷,即因子载荷,它反映了二者的关系强度
几个重要概念:1
因子载荷:某个因子与某个原变量的相关系数,主