多元统计分析整理版
doc(15页)Good is good, but better carries it
精益求精,善益求善
1、主成分分析的目的是什么
主成分分析是考虑各指标间的相互关系,利用降维的思想把多个指标转换成较少的几个相互独立的、能够解释原始变量绝大部分信息的综合指标,从而使进一步讨论变得简单的一种统计方法
它的目的是希望用较少的变量去解释原始资料的大部分变异,即数据压缩,数据的解释
常被用来寻找推断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释
2、主成分分析基本思想
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标
同时根据实际需要从中选取几个较少的综合指标尽可能多地反映原来的指标的信息
设 p 个原始变量为 ,新的变量(即主成分)为 , 主成分和原始变量之间的关系表示为
3、在进行主成分分析时是否要对原来的 p 个指标进行标准化
SPSS 软件是否能对数据自动进行标准化
标准化的目的是什么
需要进行标准化,因为因素之间的数值或者数量级存在较大差距,导致较小的数被淹没,导致主成分偏差较大,所以要进行数据标准化;进行主成分分析时 SPSS 可以自动进行标准化;标准化的目的是消除变量在水平和量纲上的差异造成的影响
求解步骤 对原来的 p 个指标进行标准化,以消除变量在水平和量纲上的影响 根据标准化后的数据矩阵求出相关系数矩阵 求出协方差矩阵的特征根和特征向量 确定主成分,并对各主成分所包含的信息给予适当的解释版本二:根据我国 31 个省市自治区 2025 年的 6 项主要经济指标数据,表二至表五,是 SPSS 的输出表,试解释从每张表可以得出哪些结论,进行主成分分析,找出主成分并进行适当的解释:(下面是 SPSS 的输出结果,请根据结果写出结论)表一:数据输入界面表二:数据输出界面 a)此表为相关系数