相关分析一、两个变量的相关分析:Bivariate1.相关系数的含义相关分析是讨论变量间密切程度的一种常用统计方法。相关系数是描述相关关系强弱程度和方向的统计量,通常用 r 表示.①相关系数的取值范围在—1 和+1 之间,即:–1≤r≤ 1。②计算结果,若 r 为正,则表明两变量为正相关;若 r 为负,则表明两变量为负相关。③相关系数 r 的数值越接近于 1(–1 或+1),表示相关系数越强;越接近于 0,表示相关系数越弱。假如 r=1 或–1,则表示两个现象完全直线性相关.假如=0,则表示两个现象完全不相关(不是直线相关)。④,称为微弱相关、,称为低度相关、,称为显著(中度)相关、,称为高度相关⑤r 值很小,说明 X 与 Y 之间没有线性相关关系,但并不意味着 X 与 Y 之间没有其它关系,如很强的非线性关系。⑥直线相关系数一般只适用与测定变量间的线性相关关系,若要衡量非线性相关时,一般应采纳相关指数 R。2.常用的简单相关系数(1)皮尔逊(Pearson)相关系数皮尔逊相关系数亦称积矩相关系数,1890 年由英国统计学家卡尔•皮尔逊提出。定距变量之间的相关关系测量常用 Pearson 系数法。计算公式如下: (1)(1)式是样本的相关系数。计算皮尔逊相关系数的数据要求:变量都是服从正态分布,相互独立的连续数据;两个变量在散点图上有线性相关趋势;样本容量。(2)斯皮尔曼(Spearman)等级相关系数Spearman 相关系数又称秩相关系数,是用来测度两个定序数据之间的线性相关程度的指标。当两组变量值以等级次序表示时,可以用斯皮尔曼等级相关系数反映变量间的关系密切程度。它是根据数据的秩而不是原始数据来计算相关系数的,其计算过程包括:对连续数据的排秩、对离散数据的排序,利用每对数据等级的差额及差额平方,通过公式计算得到相关系数.其计算公式为: (2)(2)式中,为等级相关系数;为每对数据等级之差;为样本容量。斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行讨论。(3)肯德尔(Kendall)等级相关系数肯德尔(Kendall)等级相关系数是在考虑了结点(秩次相同)的条件下,测度两组定序数据或等级数据线性相关程度的指标.它利用排序数据的秩,通过计算不一致数据对在总数据对中的比例,来反映变量间的线性关系的。其...