记录软件应用数据分析汇报课程名称:记录软件应用专业:级注会学号:409109姓名:牛牧童SPSS聚类分析试验汇报一、试验目的:1、理解聚类分析的有关理论与应用2、熟悉运用聚类分析对经济、社会问题进行分析3、纯熟SPSS软件有关操作二、试验规定:1、生成新变量总消费支出=各变量之和2、对变量食品支出和居住支出进行配对样本T检查,并阐明检查成果3、对各省的总消费支出做出条形图4、运用K-Mean法把31省提成3类5、对聚类分析成果进行解释阐明6、完毕试验汇报三、试验措施与环节准备工作:把试验所用数据从Word文档复制到Excel,并深入导入到SPSS数据文献中
分析:由于本试验中要对31个个案进行分类,数量比较大,用系统聚类法当然也可以得出成果,不过相比之下在数据量较大时,K均值聚类法更迅速高效,并且精确性更高
四、试验成果与数据处理:1
用系统聚类法对所有个案进行聚类:生成新变量总消费支出=各变量之和如图所示:2
对变量食品支出和居住支出进行配对样本T检查,如图所示:得出结论:3
对各省的总消费支出做出条形图,如图所示:4.对聚类分析成果进行解释阐明:K均值分析将这样的都市分为三类:第一类北京、上海、广东第二类除第一类第三类以外的第三类天津、福建、内蒙古、辽宁、山东第一类经济发展水平高,各项支出占总支出比重高,人民生活水平高
第二类都市位于中西部地区,经济落后,人民消费水平低
第三类都市位于中东部地区,经济发展很好
初始聚类中心聚类123食品支出7776
983052
575790
72衣着支出1794
061205
891281
25居住支出2166
221245
001606
27家庭设备及服务支出1800
24医疗保健支出1005
36交通和通信支出4076
461340
902196
88文化与娱乐服务支出3363