某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515 个成年人,其中吸烟者 220 人,不吸烟者 295 人,调查结果是:吸烟的 220 人中 37 人患病, 183 人不患病;不吸烟的 295 人中 21 人患病, 274 人不患病
根据这些数据能否断定:患肺癌与吸烟有关吗
患病不患病总计吸烟37183220不吸烟21274295总计58457515为了研究这个问题,我们将上述问题用下表表示:列 2×2 联表在不吸烟者中患病的比重是 在吸烟者中患病的比重是 7
82%上述结论能什么吸烟与患病有关吗
能有多大把握认为吸烟与患病有关呢
患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d列出 2×2 列联表 假设 H0 :吸烟和患病之间没有关系 即 H0 : P(AB) = P(A)P(B) 其中 A 为某人吸烟, B 为某人患病 设 n = a + b + c + d 则 P(A) nba P(B) nca 故 P(AB) ncanba吸烟且患病人数ncanbanABPn)(吸烟但未患病人数ndbnbanBAPn)(不吸烟但患病人数ncandcnBAPn)(不吸烟且未患病人数ndbndcnBAPn)(怎样描述实际观测值与估计值的差异呢
统计学中采用ncanbanncanbana22)(ndbnbanndbnbanb2)(ncandcnncandcnc2)(ndbndcnndbndcnd2)())()()(()(22dcbadbcabcadn化简得 2(2观测值预期值)用卡方统计量:预期值来刻画实际观测值与估计值的差异
即 独立性检验第一步: H0