西南大学多元统计分析课程论文学院数学与统计学院年级专业2009级数学与应用数学论文写作唐维彬学号222009314012030资料收集李虹霖学号222009314012023软件操作刘鹏懿学号222009314012027数据分析冉俊峰学号222009314012029日期2012年10月30日基于主成分分析和因子分析评估大气污染摘要:近年来大气污染日趋严重,引起了人们的广泛关注
本文采用主成分分析法和因子分析法,为了评估某大型化工厂的污染情况,在厂区及邻近地区挑选有代表性的8个大气取样点,每日4次同时抽取大气样品,测定其中包含的6种气体的浓度,前后共4天,每个样品每种气体实测16次
最后通过数据的分析与整理,运用SPSS软件,进行主成分分析和因子分析,对该大型化工厂的污染情况做出评估,关键字:主成分分析因子分析SPSS17
0软件大气污染正文主成分分析法(一)主成分分析原理主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标
通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标
最经典的做法就是用(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var()越大,表示包含的信息越多
在所有的线性组合中选取的应该是方差最大的,故称为第一主成分
如果第一主成分不足以代表原来P个指标的信息,再考虑选取即选第二个线性组合,为了有效地反映原来信息,已有的信息就不需要再出现在中,用数学语言表达就是要求Cov(,)=0,则称为第二主成分,依此类推可以构造出第三、第四,,第P个主成分
(二)主成分分析数学模型其中,,,(i=1,,m)为X的协方差阵Σ的特征值多对应的特征向量,,,,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文