1 华东理工大学2009—20010学年 第 一 学期 《 应用统计学 》实验报告 5 班级 学号 姓名 开课学院 商学院 任课教师 成绩 实验内容:实验 5 5.1 熟悉SPSS 中聚类分析的距离选择功能 5.2 熟悉SPSS 中聚类分析的系统聚类功能 实验要求: 5.1 选用例题6.2 文件中的变量,完成系统聚类法的各种结果的比较分析 5.2 对案例:Crop’Pain 连锁店,展开聚类分析讨论 教师评语: 教师签名: 年 月 日 实验报告: 5.1 点击 Analyze-Classify-Hierarchical Cluster,选用欧氏距离Euclidean distance ---dij(2)。在 Method 中选择Euclidean distance ---dij(2)。在 plots 里面点击 dendrogram 聚类图。点击 OK 按妞。Output 中出现如下几张表 表一 Case Processing Summary(a,b) Cases Valid Missing Total N Percent N Percent N Percent 21 100.0 0 .0 21 100.0 a Eu clidean Distance u sed b Single Linkage 分析:表一中,cases表明实验是对样品进行分类的。Valid下面的数据21表明有效数据共21组,占总数据的百分比为100%,而陪排除的无效数据(missing)为0,百分比为0%。总数据为21组。 2 表二 Agglomeration Schedu le Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2 1 17 19 1.000 0 0 2 2 17 18 1.000 1 0 8 3 12 13 1.000 0 0 10 4 8 9 1.000 0 0 5 5 7 8 1.000 0 4 11 6 5 6 1.000 0 0 14 7 1 2 1.000 0 0 16 8 17 20 1.414 2 0 12 9 11 15 1.414 0 0 10 10 11 12 1.414 9 3 13 11 7 10 1.414 5 0 20 12 17 21 2.000 8 0 17 13 11 14 2.000 10 0 19 14 4 5 2.000 0 6 15 15 3 4 2.000 0 14 16 16 1 3 2.000 7 15 18 17 16 17 2.236 0 12 18 18 1 16 2.236 16 17 19 19 1 11 2.236 18 13 20 20 1 7 2.236 19 11 0 分析:表二中,coefficients下对应的数字为分类的系数,Next stage表明被聚合成一类的数据,其下一步将会参与到哪个阶段的聚类当中,比如说Stage2所对应的next stage为stage 8,表明stage2中的数据或者数据会参与到第8阶段的聚合中,而由stage8可知,数据17缺确实与数据20进行了聚类。 ...