精品文档---下载后可任意编辑理学院 信息与计算科学专业 实验报告课程名称《数据分析》 实验名称《主成分分析和聚类分析》实验地点: 基础楼 C-423 日期_____ 姓名张丽芝班级 信 131 学号 202407010108___指导老师 王恒友成 绩【实验目的】(1)熟悉利用主成分分析进行数据分析,能够使用 SPSS 软件完成数据的主成分分析;(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用 SPSS 软件完成该任务。【实验要求】根据各个题目的具体要求,分别运用 SPSS 软件完成实验任务。【实验内容】1、(数据见)给出了 1991 年我国 30 个省市、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)X1: 人均粮食支出; X2:人均副食支出;X3: 人均烟酒茶支出; X4: 人均其他副食支出;X5:人均衣着商品支出; X6: 人均日用品支出;X7: 人均燃料支出;X8: 人均非商品支出。(1)求样本相关系数矩阵 R。(2)从 R 出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;2、(1)对题 1 中的数据,根据原有的八个指标,对 30个省份进行聚类,给出分为 3 类的聚类结果。(2)利用题 1 得到的前 2 个主成分指标,分别按最短距离法(最近邻居距离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、重心距离法;其中距离均采纳欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为 3 类的聚类结果。并与(1)的结果进行比较【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)11)相关矩阵V2V3V4V5V6V7V8V9相关V2.334.199.349.319V3.334.399.711.414.835V4.533.497.033V5.399.533.698.468.313V6.497.698.280V7.199.711.033.468.280.417.702V8.349.414.417.399V9.319.835.313.702.3992)表:方差贡献率和累计贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %123.9204.7065.4986.2307.1318.051.643提取方法:主成份分析。由上图可知, 只有前两个成分的特征值大于 1,所以只选择前两个主成分。第一个主成分的方差贡献率是 38.704%,第二个主成分的方差贡献率是 29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为 68.294%,选择前两个主成分即可代表绝大多...