怎样进行独立性检验(B版)一、独立性检验的基本思想独立性检验的基本思想类似于数学中的反证法.其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度.它首先假设结论不成立,即“两个分类变量没有关系”成立,在该假设下,构造的随机变量2X的值应该很小.如果由观测数据计算得到的2X的观测值很大,则在一定程度上说明假设不合理.因此可以根据随机变量2X的含义来确定该假设不合理的程度.如果2X>6.635,则说明该假设不合理的程度是99%,从而可认为“两个分类变量有关系”这一结论成立的可信程度为99%.二、独立性检验的相关概念1.2×2列联表一般地,如果有两个分类变量X和Y,它们的值域分别是1212{}{}xxyy,,,,它们的样本频数列联表(见下表)称为2×2列联表.2.2X统计量2X统计量是统计学中的一个非常有用的统计量,它是根据概率的统计定义和事件的独立性得到的,其计算公式是22112212211212()nnnnnnnnnX.利用它的大小可以决定是否拒绝原来的统计假设,如果计算出的2X值较大,就拒绝假设;如果2X值较小,就接受假设.3.临界值通过对2X统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常用的有两个:3.841和6.635.在对具体问题进行独立性检验时,把计算出的2X值与以上两个临界值进行对比,从而确定两个事件的关系.三、独立性检验步骤使用2X统计量作2×2列联表的独立性检验的步骤是:(1)检查2×2列联表中的数据是否符合要求;(2)由公式22112212211212()nnnnnnnnnX计算出2X的值;(3)将2X的值与两个临界值进行对比,进而作出统计推断:如果计算出的2X>3.841,则有95%的把握说两个事件有关;如果计算出的2X>6.635,则有99%的把握说两个事件有关;如果计算出的2X≤3.841,则认为两个事件是无关的.四、独立性检验的应用举例例1运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对160位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?用心爱心专心解:由22112212211212()nnnnnnnnnX2160(19207645)38.97495656496.因为38.974>6.635,所以有99%的把握说,运动员受伤与不做热身运动有关.例2某些行为在运动员的比赛之间往往被赋予很强的神秘色彩,如有一种说法认为,在进入某乒乓球场比赛前先迈入左脚的运动员就会赢得比赛的胜利.某记者为此追踪了某著名乒乓球运动员在该球场中的308场比赛,获得数据如下表:据此资料,你能得出什么结论?解:由22112212211212()nnnnnnnnnX2308(178198427)1.50220510326246。.因为1.502<3.384,所以我们认为先迈进左脚与否跟比赛的胜负是无关的.五、注意事项1.使用2X统计量作2×2列联表的独立性检验时,要求表中的四个数据都要大于5,因此在选取样本时一定要注意.2.要注意独立性检验的结论与实际问题的差异,独立性检验的结论是一个数学统计量,它与实际问题的确定性是存在差异的.3.独立性检验的结论不只是对样本成立,它对总体来说也是成立的,这体现了统计的意义.用心爱心专心