聚类分析实验报告《应用多元统计分析》课程实验报告实验名称:用聚类分析的方法研究山东省17 个市的产业类型的差异化学生班级:统计 0901 学生姓名:贾绪顺 杜春霖陈维民 张鹏指导老师: ____________张艳丽 _____________________ 完成日期:2011.12.12 一, 实验内容根据聚类分析的原理, 使用系统聚类分析的COMplete linkage (最长距离法 )和WARD(离差平方和法 ) ,运用 SPSS软件对 2009年山东省 17个城市生产总值的数据进行 Q型聚类,将 17个城市分为5类,发现不同城市产业类型的差异化,并解释造成这种差异的原因二, 实验目的希望通过实验研究山东省17 个市的生产总值的差异化, 并分析造成这种差异化的原因,可以更深刻的掌握聚类分析的原理;进一步熟悉聚类分析问题的提出、 解决问题的思路、 方法和技能;达到能综合运用所学基本理论和专业知识;锻炼收集、整理、运用资料的能力的目的;希望能会调用 SPSS软件聚类分析有关过程命令,并且可以对数据处理结果进行正确判断分析,作出综合评价。三,实验方法背景与原理3.1 方法背景聚类分析又称群分析, 是多元统计分析中研究样本或指标的一种主要的分类方法,在古老的分类学中, 人们主要靠经验和专业知识,很少利用数学方法。 随着生产技术和科学的发展, 分类越来越细,以致有时仅凭经验和专业知识还不能进行确切分类, 于是数学这个有用的工具逐渐被引进到分类学中, 形成了数值分类学。 近些年来,数理统计的多元分析方法有了迅速的发展,多元分析的技术自然被引用到分类学中,于是从数值分类学中逐渐的分离出聚类分析这个新的分支。结合了更为强大的数学工具的聚类分析方法已经越来越多应用到经济分析和社会工作分析中。在经济领域中, 主要是根据影响国家、 地区及至单个企业的经济效益、 发展水平的各项指标进行聚类分析, 然后很据分析结果进行综合评价,以便得出科学的结论。聚类分析源于很多领域, 包括数学, 计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类分析的主要应用, 在商业方面, 最常见的就是客户群的细分问题, 可以从客户人口特征、 消费行为和喜好方面的数据, 对客户进行特征分析, 充分利用数据进行客户的客观分组, 使诸多特征有相似性的客户能被分在同一组内, 而不相似的客户...