主成分分析法与因子分析法主要内容主成分分析法因子分析法附:主成分分析法与因子分析法的区别主成分分析法(PrincipalComponentsAnalysis,PCA)主成分分析法概述主成分分析的基本原理主成分分析的计算步骤一、主成分分析概述假定你是一个公司的财务经理,掌握了公司的所有数据,这包括众多的变量,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等
如果让你向上级或有关方面介绍公司状况,你能够把这些指标和数字都原封不动地摆出去吗
引子当然不能
发现在如此多的变量之中,有很多是相关的
人们希望能够找出它们的少数“代表”来对它们进行描述
需要把这种有很多变量的数据进行高度概括,用少数几个指标简单明了地把情况说清楚
主成分分析法(PrincipalComponentsAnalysis)和因子分析法(FactorAnalysis)就是把变量维数降低以便于描述、理解和分析的方法
主成分分析也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息,所含的信息又互不重叠,即它们之间要相互独立,互不相关
这些综合变量就叫因子或主成分,它是不可观测的,即它不是具体的变量,只是几个指标的综合
在引入主成分分析之前,先看下面的例子
什么是主成分分析法
成绩数据53个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)
从本例可能提出的问题能不能把这个数据表中的6个变量用一两个综合变量来表示呢
这一两个综合变量包含有多少原来的信息呢
事实上,以上问题在平时的研究中,也会经常遇到
它所涉及的问题可以推广到对企业、对学校、对区域进行分析、评价、排序和分类等