叶小华DepartmentofEpidemiology&BiostatisticsHealthstatistics卫生统计学---两变量关联性分析统计方法回顾身高凝血酶浓度t检验两个总体均数相等:0H:0H方差分析多个总体均数相等上网时间满意度婴儿腹泻ABO血型研究目的:组间比较:0H秩和检验两个(多个)总体中位数相等2检验,确切概率法两个(多个)总体概率分布相同:0H研究目的:两随机变量间的关系上网时间和考试分数的关系收入和生活满意度的关系婴儿腹泻和婴儿喂养方式的关系ABO血型和MN血型的关系线性相关(双变量正态分布资料)秩相关(偏峰分布、分布未知、等级资料)分类变量的关联性分析(二分类和无序多分类资料)身高和体重的关系凝血酶浓度和凝血时间的关系线性相关(linearCorrelation)秩相关(rankcorrelation)分类变量的关联性分析outline线性相关(linearCorrelation)KarlPearson1857-1936SirFrancisGalton1822-1911线性相关研究两个随机变量间有无直线相关关系,相关的方向及密切程度
条件:双变量正态分布散点图相关系数XY正相关(PositiveCorrelation)XY负相关(NegativeCorrelation)XY非线性相关XY零相关(zeroCorrelation)线性相关系数Pearson积差相关系数——描述两个变量间相关关系的密切程度与相关方向的指标
r:样本相关系数ρ:总体相关系数线性相关系数))((的方差的方差的协方差和相关系数YXYX1))((1nyyxxYXniii的样本协方差和1)(12nxxXni的方差1)(12nyyYni的样本方差1)0)(0(1nsyysxxrniyixi--去单位1))((1nyyxx