一、引言 主成分分析和因子分析在社会经济统计综合评价中是两个常被使用的统计分析方法
现在 SPSS、SAS 等统计软件使用越来越普遍,但 SPSS 并未像 SAS 一样,将主成分分析与因子分析作为两个独立的方法并列处理[注:主成分分析与因子分析二者是又有着区别与联系,最主要的不同在于它们的数学模型的构建上,具体区别请见参考文献 2],而是根据二者之间的关系有机地将主成分分析嵌入到因子分析之中,这样虽然简化了分析程序,却为主成分分析的计算带来不便
且国内许多 SPSS 教程并没有详细讲解如果应用 SPSS 进行主成分分析,如何使用 SPSS 对主成分分析进行计算呢
为使读者能够正确使用 SPSS 软件进行主成分分析,本文将通过一个实例来详细介绍如何用 SPSS 做主成分分析
接下来先简单介绍主成分分析原理与模型,以便读者对主成分分析有个大致的了解
二、主成分分析原理和模型[1] (一)主分成分析原理 主成分分析是设法将原来众多具有一定相关性(比如 P 个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标
通常数学上的处理就是将原来 P 个指标作线性组合,作为新的综合指标
最经典的做法就是用 F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即 Var(F1)越大,表示 F1包含的信息越多
因此在所有的线性组合中选取的 F1应该是方差最大的,故称 F1为第一主成分
如果第一主成分不足以代表原来 P 个指标的信息,再考虑选取 F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再 F2中,用数学语言表达就是要求 Cov(F1, F2)=0,则称 F2为第二主成分,依此类推可以构造出第三、第四,……,第 P 个主成分
(二)主成分分析数学模型 F2=a12ZX1+a22ZX2„„+ap2ZXp „„ Fp=a1mZX1+a2mZX2+