精品文档---下载后可任意编辑理学院 信息与计算科学专业 实验报告课程名称《数据分析》 实验名称《主成分分析和聚类分析》实验地点: 基础楼 C-423 日期_____ 姓名张丽芝班级 信 131 学号 202407010108___指导老师 王恒友成 绩【实验目的】(1)熟悉利用主成分分析进行数据分析,能够使用 SPSS 软件完成数据的主成分分析;(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用 SPSS 软件完成该任务
【实验要求】根据各个题目的具体要求,分别运用 SPSS 软件完成实验任务
【实验内容】1、(数据见)给出了 1991 年我国 30 个省市、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)X1: 人均粮食支出; X2:人均副食支出;X3: 人均烟酒茶支出; X4: 人均其他副食支出;X5:人均衣着商品支出; X6: 人均日用品支出;X7: 人均燃料支出;X8: 人均非商品支出
(1)求样本相关系数矩阵 R
(2)从 R 出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;2、(1)对题 1 中的数据,根据原有的八个指标,对 30个省份进行聚类,给出分为 3 类的聚类结果
(2)利用题 1 得到的前 2 个主成分指标,分别按最短距离法(最近邻居距离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、重心距离法;其中距离均采纳欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为 3 类的聚类结果
并与(1)的结果进行比较【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)11)相关矩阵V2V3V4V5V6V7V8V9相关V2