1/4§7消费分布规律的分类为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类
数据见下表:指标省份X1X2X3X4X5X6X7X8辽宁浙江河南甘肃青海7
81其中,X1:人均粮食支出;X2:人均副食品支出;X3:人均烟、酒、茶支出;X4:人均其它副食品支出;X5:人均衣着商品支出;X6:人均日用品支出;X7:人均燃料支出;X8:人均非商品支出
在科学研究、生产实践、社会生活中,经常会遇到分类的问题
例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等
这些问题可以用聚类分析方法来解决
聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R型聚类法,使用的统计量是变量间的相似系数
设共有n个样品,每个样品ix有p个变量,它们的观测值可以表示为nixxxxpiiii,,2,1),,,,(21一、样品间的距离下面介绍在聚类分析中常用的几种定义样品ix与样品jx间的距离
1、Minkowski距离mmpkkjkijixxxxd11][),(2、绝对值距离pkkjkijixxxxd1),(3、欧氏距离2121][),(pkkjkijixxxxd二