第四章 多元数据图表示法 图形有助于对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可从图形一目了然地看出多元数据之间的关系,当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图
当有三维数据时,虽然可以在三维坐标系里点图,但已很不方便,而当维数大于 3 时,用通常的方法已不能点图
但在许多实际问题中,多元数据的维数都大于 3
自 2 0 世纪 7 0 年代以来多元数据的图表示法一直是人们所关注的问题,人们想了不少办法,这些方法大体上分为两类:一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系;另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至 2 或 1 ,则可在平面上点图
后者可用后面介绍的主成分法、因子分析法等去解决
本章仅对前者介绍四种图表示法,更多的这类方法可在有关专著中找到
设变量数为 p,观测次数为 n,第 次观测值记为nnxxxXapaaa,,,1,),,,(21次观测数据组成的矩阵为pnijxX)(
例 考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表(摘自 1 9 9 6 年中国统计年鉴): (单位:元) 肉禽及制品 住 房 医疗保健 交通和通讯 文娱用品及服务 北京 5 6 3
5 1 2 2 7
7 8 1 4 7
7 6 2 3 5
9 9 5 1 0
7 8 天津 6 7 8
9 2 3 6 5
0 7 1 1 2
8 2 3 0 1
4 6 4 6 5
8 8 陕西 2 3 7
3 8 1 7 4
4 8 1 1 9
7 8 1 4 1
0 7 2 4 5
5 7 甘肃 2 5 3
4 1 1 5 6
1 3 1 0 2
9 6 1 0 8
1 3 2 1