第三章多元数据图表示法3.1轮廓图3.2雷达图3.3调和曲线图3.4星座图3.5脸谱图本章学习目标领会作多元数据图的思想。会作简单的多元数据图形并且会分析图形。第三章多元数据图表示法图形有助于我们对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可以从图形一目了然地看出多元数据之间的关系。当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图;当有三维数据时,也可以使用空间直角坐标系点图,但是已经不方便;当维数大于3时,用通常的方法已不能点图。但是在许多实际问题中,多元数据的维数都大于3。例考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表:12,,(,,,),1,,,()pijnppnXxxxnnXx设变量个数为观测次数为第次观测值记为次观测数据组成的矩阵为。肉禽及制品住房医疗保健交通和通讯文娱用品及服务北京563.51227.78147.76235.99510.78上海678.92365.07112.82301.46465.88陕西237.38174.48119.78141.07245.57甘肃253.41156.13102.96108.13212.205,4pn这个例题的变量个数观测次数多元数据图表示法的分类:一类是使高维空间的点与平面上的某种图形应,这种图形能反映高维数据的某些特点或数据间的某些关系;另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1维,则可在平面上点图。第二类分类方法可用后面介绍的主成分分析、因子分析等去解决。这一章只对第一类方法介绍四种图表示法,更多的方法可在有关专著中找到。3.1轮廓图作图步骤为:(1)作平面坐标系,横坐标取个点表示个变量。(2)对给定的一次观测值,在个点上的纵坐标(即高度)和它对应的变量取值成正比。(3)连接个高度的顶点得一折线,则一次观测值的轮廓为一条多角折线形。次观测值可画出条折线,构成轮廓图。ppnppn下图画出四条折线为北京、上海、陕西、甘肃五项指标的数据即四个省市五项指标的轮廓。0100200300400500600700800肉禽及制品住房医疗保健交通通讯娱乐教育文化北京上海陕西甘肃轮廓图由轮廓图可以看出:北京、上海的居民生活消费较高且相似;陕西、甘肃生活消费较低且相似。如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志画出折线。下表是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据考虑微机的普及应用,图形的制作则通过电脑实现。轮廓图、矩阵散点图在SPSS中制作,雷达图则在EXCEL中实现。(单位:元)地区食品衣着医疗保健交通和通信教育文化娱乐服务居住北京天津河北山西内蒙古3522.692963.851912.421712.131705.56906.21579.7587.6725.81793.53994.01697.76550.9367.47425.881688.08721.28607.75478.09596.211964.191083.91660.58799.35770.5955.771095.61595.24561.49618.18表华北5省市城镇居民家庭消费性支出在SPSS中作轮廓图的方法如下:(1)将原始数据输入SPSS中。把不同地区当成变量,而把支出指标当成观测。作轮廓图时的数据组织形式(2)选择菜单项Graphs→Line,打开LineCharts对话框,如图。在对话框上方的三个选项用于选择轮廓图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Valueofindividualcases。单击Define按钮,打开DefineMultipleLine对话框。LineCharts对话框(3)在DefineMultipleLine对话框中,将代表不同地区的5个变量移入LinesRepresent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图所示的轮廓图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。DefineMultipleLine对话框VARIABLE居住教育文化交通医疗衣着食品Value40003000200010000北京天津河北山西内蒙古轮廓图散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。利用SPSS制作矩阵散点图的步骤如下:(1)在SPSS中按图11.6的形式组织数据,...