第五章 相关性分析 在对研究对象的综合属性进行评价时,往往涉及到许多变量指标
它们有的有一定的信息重叠性,有的有一定的关联性
为了找出影响事物属性的关键本质变量指标,我们首先就需要剔除重叠性和关联性等,这就是所谓的变量之间的相关性分析
这种相关性分析主要包括:(1 )两个变量的相关性分析;(2 )多个变量的整体相关性(广义相关系数)分析;(3 )一个变量与其余多个变量(一组变量)的复相关性分析;(4 )两个变量在给定一组变量条件下的偏相关性分析;(5 )两组变量(每组为多元变量)之间的典型相关性分析
第一节 引言 在研究、分析、评价实际问题时,研究对象属性往往由多元变量指标刻画
但是,有些指标太多,有些指标包含了部分重叠信息,有些指标强烈地依赖于其它指标,这时需要对指标进行筛选以确定不相关(或者相关性不大)的、包含最多研究对象信息的、指标维数尽量小的主要指标变量
指标筛选的主要办法就是指标的相关性分析
同时,相关性分析也是数据多元分析的重要技术手段
变量间的相关性涉及到变量或变量组之间的多种相关性,下面分别阐述
(1 )两变量间的相关性
最简单的就是这种两个变量之间的相关性,通常定义一个相关系数来量化两个变量之间的相关程度
它常被用于衡量两个指标间的相关性或相似性,如在地震勘探中,要对比两个地震记录波形的相似性;在无线电技术中,要将接受信号与某已知信号对比,根据两者之间的相似性做出某种判断;更一般地,当我们观察到多个变量时,要分析多个变量间的相似性,进行根据一定的标准,对这些变量进行筛选
因此,两个变量之间的相关性是变量间相关性分析的基础
(2 )多元变量的整体相关性
如果考察的变量是一组变量(多于两个变量),则需要考察这一组变量总体的相关性,也可称为多元整体相关性分析
对于一组变量的多元整体相关性常常采用广义相关系数(相对于前面的两个变量间的相关系数而言)来量化,