某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病,183人不患病;不吸烟的295人中21人患病,274人不患病
根据这些数据能否断定:患病与吸烟有关吗
患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:2×2列联表注:什么叫列联表
列联表:列出两个分类变量的频数统计表分类变量:变量的不同“值”表示个体所属的不同类别,这样的变量称为分类变量
注:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别如性别变量,只取男、女两个值,商品的等级变量只取一级、二级,等等
性别有两种:性别变量,只取男、女两个值男、女患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:2×2列联表在不吸烟者中患病的比重是在吸烟者中患病的比重是21/295≈7
12%37/220≈16
82%上述结论能说明吸烟与患病有关吗
能有多大把握认为吸烟与患病有关呢
患病不患病总计吸烟aabba+ba+b不吸烟ccddc+dc+d总计a+ca+cb+db+da+b+ca+b+c+d+d如果“吸烟与患病没有关系””,则在吸烟者中不患病的比例应该与不吸烟者中相应的比例差不多,即0acacdcabadbcabcd因此|ad-bcad-bc|越小,说明吸烟与患病之间关系越弱;|ad-bcad-bc|越大,说明吸烟与患病之间关系越强
为便于研究,用字母代替数据,得2×2列联表患病不患病总计吸烟aabba+ba+b不吸烟ccddc+dc+d总计a+ca+cb+db+da+b+ca+b+c+d+d列出2×2列联表我们不妨作出相反的假设,H0:吸