基于秩次的假设检验方法XX流行病与卫生统计学系【例【例11】】某医师用改良的Seldinger’s插管技术对8例经临床和病理证实的恶性滋养细胞肿瘤进行选择性盆腔动脉插管灌注化疗。测定治疗前后血中的HCG含量如表1。该医师考虑到数据相差较大,采用对数变换后进行两样本均数比较的t检验,得t=2.460,P<0.05,差异有统计学意义,故认为治疗前后血中HCG的含量有差别。表1灌注化疗前后HCG含量测定结果(pmol/L)病例号(1)灌注前(x1)(2)灌注后(x2)(3)lgx1(4)lgx2(5)112800002100006.10725.322227550033004.87793.518531245022104.09523.3444415000009.36.17610.968551000025004.00003.39796970012033.98683.080371558848254.19283.6835842239143.62562.9609【问题1】(1)这是什么资料?(2)该实验属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1)该资料为计量资料。(2)该实验属自身配对设计方案。(3)该医师统计方法不正确。首先,配对资料一般采用对每对数据求之差值后进行比较,而该医师采用完全随机设计资料的检验方法,统计方法与设计类型不符;其次,该医师考虑了数据相差较大,即不满足t检验的前提条件正态分布,采用了对数变换,基本思想正确。但治疗前后的数据经对数变换后,其差值的变异仍然较大(经正态性检验,P<0.05),因此仍不满足配对t检验的条件,故该资料宜采用非参数检验方法,即Wilcoxon配对设计的符号秩和检验,目的是推断配对资料的差值是否来自中位数为零的总体。•前面介绍的t检验、方差分析等假设检验方法,大都假定样本所来自的总体分布为正态分布,但其参数(即正态总体均数)为未知,统计推断的目的就是对这些未知参数进行检验,这一类依赖于总体分布的具体形式的统计推断方法称为参数统计方法或参数检验(parametrictest)。•但在许多实际问题中,如例1资料呈明显偏态,或分布不明的资料,需要用另一类不依赖总体分布类型的检验即非参数统计方法或非参数检验(nonparametrictest),或任意分布检验(distribution-freetest)。流行病与卫生统计系首都医科大学公共卫生学院条件不满足时条件不满足时————采用非参数统计的方法采用非参数统计的方法参数检验的特点•分析目的:对总体参数(μπ)进行估计或检验•分布:要求总体分布已知,如:•连续性资料——正态分布•计数资料——二项分布、POISSON分布等•统计量:有明确的理论依据(t分布、Z分布)•有严格的适用条件,如:•正态分布Normal•总体方差齐EqualVariance•数据间相互独立IndependentIndependent?非参数检验的优点在于它不受总体分布的限制,因此它的适用范围广,且方法简便易学。但适宜参数检验方法的资料,如果用非参数检验方法,由于没有充分利用资料提供的信息,就降低了检验效率,即第Ⅱ类错误的概率增大。故适合参数检验条件的资料,应首选参数检验,但若参数检验的条件得不到满足,则非参数检验更适合。非参数检验方法很多,本章介绍常用的秩转换(ranktransformation)的非参数检验即秩和检验(ranksumtest)。秩和检验的适用范围:①未加精确测量的资料(包括等级资料)如“>50mg”、“<0.01mg”;②偏态分布且无法转化为正态分布的资料;③分布不清的资料。秩和检验•秩次:指将观察值由小到大按升序排列后,每个数据的次序号(Rank)•编秩:将观察值按顺序由小到大排列,并用序号代替原始变量值本身•秩和:用秩次号代替原始数据,并对某些秩次号求和(Rsum)•相持:出现相同秩次的现象Xi159183178513719Ri75918426310R_sum55秩次和秩和•设有以下两组数据:–A组4.76.42.63.25.2–B组1.72.63.62.33.7•两组各有5个变量值。现在依从小到大的顺序将它们排列起来,并标明秩次,结果如下:–A组2.63.24.75.26.4–B组1.72.32.63.63.7–秩次12345678910–A组秩和:3.5+5+8+9+10=39.5–B组秩和:1+2+3.5+6+7=19.5•从两组的原始变量值也可以初步看出:A组偏大,B组偏小。现在得出的秩和也是A组大于B组,与由变量值所观察到的一致秩次(rank)—将数值变量值从小到大,或等级变量值从弱到强所排列的序号例111只大鼠存活天数:4,10,7,50,3,15,2,9,13,>60,>60例29名肺炎病人的治疗结果:治愈治...