因子分析信计学院统计系沈菊红第八章因子分析因子分析的基本原理因子载荷阵的求解因子载荷和变量共同度的统计意义因子旋转因子分析方法应用实例变量的相关性公共因子?将多个具有错综复杂关系的变量转换成少数几个不相关的综合指数(因子)?问题的提出20世纪初由KarlPearson和ChalesSpearman关于智力的定义和测量工作而开始了因子分析的近代发展。Spearman对学生考试所得的分数做了分析,他注意到在分数之间的相关矩阵中存在一定的系统影响,下表是某学校33个学生6门功课的相关系数矩阵:一、概述1234561.古典语2.法语3.英语4.数学5.判别6.音乐10.830.780.700.660.6310.670.670.650.5710.640.540.5110.540.5110.41表中课程是按照相关系数从上到下递减排列的。Spearman注意到相关矩阵中一个有趣的规律:如果不考虑对角元素的话,任意两列的元素大致例1成比例,对1列和3列有:0.830.700.660.631.20.670.640.540.51iiixaF那么各门功课相关的“效应”就可以被说明。其中是对所有变量都起作用的公因子,是对所特有的,即每门课程的考试成绩可以看作由一个公因子(与智力相一致)和一个特殊因子之和组成。iix于是Spearman指出第i个变量(第i门功课)上的分数都遵从以下形式:F例2考虑人的五个生理指标:收缩压(),舒张压(),心跳间隔(),呼吸间隔(),舌下温度()。从生理学的知识知道这五个指标是受植物神经的交感神经和副交感神经这两个因子的共同影响,即这五个指标至少受到两个公共因子的作用,如果用分别表示交感神经和副交感神经,那么可以设想变量是的线性函数,再加上其它对有影响的因子,即1x3x2x5x4x12,FF15(,,)xxx12(,)FFFix1111122155115225xaFaFxaFaF表示两个因子,称为公共因子;系数称为因子载荷,表示对第i个变量的影响程度;为特殊因子,是其它不能被两个因子包括的对有影响的部分。这样五个生理变量之间的相关效应就可以通过公因子和特殊因子来说明。12,FF12,iiaa12,FFiix2(0,)iiN因子分析是主成分分析的推广和发展,它是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是处理降维的一种统计方法。因子分析的任务,首先是估计出,然后将抽象因子赋予实际背景的解释或给以命名。ija2iiF什么是因子分析因子分析R型因子分析:对变量Q型因子分析:对样品基本思想通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量(不可观测)去描述多个变量之间的相关关系;然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。相对于主成分分析,因子分析更倾向于描述原始变量之间的相关关系。因此,因子分析的出发点是原始变量的相关矩阵。二、因子分析模型一般地,设为可观测的随机变量,且有NoImage1111122112211222221122mmmmppppmmpxaFaFaFxaFaFaFxaFaFaF12(,,,)pxxxX1.数学模型(8.1)用矩阵表示:111121112212222212mmppppmpmxaaaFxaaaFxaaaFXAFε为公共(共性)因子(commonfactor),简称因子(factor)■为特殊因子(specificfactor)和均为不可直接观测的随机变量称为因子载荷是第i个变量在第j个公共因子上的负荷,为因子负荷(载荷)(factorloading)矩阵。12(,,,)pε()ijpmAa12(,,,)mFFFFFε高维空间中的互相垂直的m个坐标ija通常先对作标准化处理,使标准化得到的新变量。这样就有假定(1)(2)(3),即和不相关。则称(8.1)为具有m个公因子的正交因子模型。()0,EF();mDFI()0,Eε212220()0pDεXAFε(,)0CovFεFεX()0,()1EVarXX如果与相关时(),则不是对角阵,此时的模型称为斜交因子模型。iFjFij...