怎样进行独立性检验(B版)一、独立性检验的基本思想独立性检验的基本思想类似于数学中的反证法
其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度
它首先假设结论不成立,即“两个分类变量没有关系”成立,在该假设下,构造的随机变量2X的值应该很小
如果由观测数据计算得到的2X的观测值很大,则在一定程度上说明假设不合理
因此可以根据随机变量2X的含义来确定该假设不合理的程度
如果2X>6
635,则说明该假设不合理的程度是99%,从而可认为“两个分类变量有关系”这一结论成立的可信程度为99%
二、独立性检验的相关概念1
2×2列联表一般地,如果有两个分类变量X和Y,它们的值域分别是1212{}{}xxyy,,,,它们的样本频数列联表(见下表)称为2×2列联表
2X统计量2X统计量是统计学中的一个非常有用的统计量,它是根据概率的统计定义和事件的独立性得到的,其计算公式是22112212211212()nnnnnnnnnX
利用它的大小可以决定是否拒绝原来的统计假设,如果计算出的2X值较大,就拒绝假设;如果2X值较小,就接受假设
临界值通过对2X统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常用的有两个:3
在对具体问题进行独立性检验时,把计算出的2X值与以上两个临界值进行对比,从而确定两个事件的关系
三、独立性检验步骤使用2X统计量作2×2列联表的独立性检验的步骤是:(1)检查2×2列联表中的数据是否符合要求;(2)由公式22112212211212()nnnnnnnnnX计算出2X的值;(3)将2X的值与两个临界值进行对比,进而作出统计推断:如果计算出的2X>3
841,则有95%的把握说两个事件有关;如果计算出的2X>6
635,则有99%的把握说两个事件有关;如果计算出的2X≤3
841,则认为两个