第4节主成分分析与因子分析主成分分析因子分析地理系统是多要素的复杂系统
在地理学研究中,多变量问题是经常遇到
变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的
因此,人们就希望能找出少数几个互不相关的综合变量来尽可能地反映原来数据所含有的绝大部分信息
而主成分分析和因子分析正是为解决此类问题而产生的多元统计分析方法
问题的提出:主成分分析与因子分析方法的出发点,都是变量的协方差矩阵或相关系数矩阵
其分析的思路,都是在损失较少信息的前提下,把多个变量综合成少数几个综合变量,而且这少数几个综合变量所代表的信息不重叠
但是,二者是有区别的
主成分分析:是通过变量变换(通常用可观测的原变量的线性组合表示),找出相互独立的新变量(主成分),保留那些变差较大的主成分,而舍弃那些变差小的主成分
因子分析:则是把原观测变量分解成公共因子和特殊因子两部分,从而保留公共因子,舍弃特殊因子
从本质上看,因子分析是主成分分析的延伸和拓展
一、主成分分析主成分分析的基本原理主成分分析的计算步骤主成分分析实例一、主成分分析的基本原理主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术
假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵npnnppxxxxxxxxxX212222111211(4
1)当p较大时,在p维空间中考察问题比较麻烦
为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的
定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标,则