某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515 个成年人,其中吸烟者 220 人,不吸烟者 295 人,调查结果是:吸烟的 220 人中 37 人患病, 183 人不患病;不吸烟的 295 人中 21 人患病, 274 人不患病。 根据这些数据能否断定:患肺癌与吸烟有关吗?患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:列 2×2 联表在不吸烟者中患病的比重是 在吸烟者中患病的比重是 7.12%16.82%上述结论能什么吸烟与患病有关吗?能有多大把握认为吸烟与患病有关呢?患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d列出 2×2 列联表 假设 H0 :吸烟和患病之间没有关系 即 H0 : P(AB) = P(A)P(B) 其中 A 为某人吸烟, B 为某人患病 设 n = a + b + c + d 则 P(A) nba P(B) nca 故 P(AB) ncanba吸烟且患病人数ncanbanABPn)(吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数ndbndcnBAPn)(怎样描述实际观测值与估计值的差异呢?统计学中采用ncanbanncanbana22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)())()()(()(22dcbadbcabcadn化简得 2(2观测值预期值)用卡方统计量:预期值来刻画实际观测值与估计值的差异.即 独立性检验第一步: H0 : 吸烟和患病之间没有关系 通过数据和图表分析,得到结论是:吸烟与患病有关结论的可靠程度如何? 患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d第二步:列出 2×2 列联表 用 χ2 统计量研究这类问题的方法步骤第三步:引入一个随机变量:卡方统计量第四步:查对临界值表,作出判断。dcban其中22n adbcabcdacbdP(≥x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(χ≥x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828828.102 635.62 706.22 706.22 0.1% 把握认为 A 与 B 无关1%...