两变量关联性分析pearson相关系数介绍世间万物是普遍联系的医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、年龄与血压、产前检查与婴儿体重、乙肝病毒与乙肝等
在这些有关系的现象中,它们之间联系的程度和性质也各不相同
相关的含义图5-0(a)函数关系客观现象之间的数量联系存在着函数关系和相关关系
当一个或几个变量取定值时,另一个变量有确定的值与之对应,称为函数关系,可用Y=f(X)表示
当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关(correlation)
两个变量有共变现象,称为有相关关系
相关关系不一定是因果关系
主要探讨线性相关——pearson相关系数主要内容一、散点图二、相关系数三、相关系数的假设检验一、散点图为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的
例如,每人的身高和体重
然后在直角坐标系上描述这些点,这一组点集称为散点图
作法:为了研究父亲与成年儿子身高之间的关系,卡尔
皮尔逊测量了1078对父子的身高
把1078对数字表示在坐标上,如图
用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图
它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆
相关类型:3
作用:粗略地给出了两个变量的关联类型与程度通过相关散布图的形状,我们大概可以判断变量之间相关程度的强弱、方向和性质,但并不能得知其相关的确切程度
为精确了解变量间的相关程度,还需作进一步统计分析,求出描述变量间相关程度与变化方向的量数,即相关系数
总体相关系数用p表示,样本相关系数用r表示
二、相关系数变量的取值区间越大,观测值个数越多,相关系数受抽样误差的影响越小,结果就越可靠,如果数据较少,本不相关的两列变量,计算的结果可能相关
相关系数取值