2独立性检验的基本思想及其初步应用(二)高二数学选修2-3第三章统计案例不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d把表中的数字用字母代替,得到如下用字母表示的列联表H0:吸烟与患肺癌没有关系
用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于P(AB)=P(A)P(B)
2×2列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+da+bP(A),na+cP(B),n
aP(AB)n在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数
由于频率接近于概率,所以在H0成立的条件下应该有因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强
adbc即(a+b+c+d)a(a+b)(a+c),aa+ba+c≈×nnn其中为样本容量,即n=a+b+c+d随机变量-----卡方统计量22(),()()()()其中为样本容量
nadbcKabcdacbdnabcd1、独立性检验0
8280k0)k2P(K临界值表828
102K635
62K706
22K22
706K0
1%把握认为A与B无关1%把握认为A与B无关99
9%把握认A与B有关99%把握认为A与B有关90%把握认为A与B有关10%把握认为A与B无关没有充分的依据显示A与B有关,但也不能显示A与B无关第一步:H0:吸烟和患病之间没有关系患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d