2《独立性检验的基本思想及其初步应用》吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大
28%探究不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计98749199651、列联表2、三维柱形图3、二维条形图不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000从三维柱形图能清晰看出各个频数的相对大小
从二维条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例
通过图形直观判断两个分类变量是否相关:不吸烟吸烟00
91不吸烟吸烟患肺癌比例不患肺癌比例4、等高条形图等高条形图更清晰地表达了两种情况下患肺癌的比例
上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢
这需要用统计观点来考察这个问题
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,为此先假设H0:吸烟与患肺癌没有关系
不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d把表中的数字用字母代替,得到如下用字母表示的列联表用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于P(AB)=P(A)P(B)
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强
不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+dadbc即aa