第三章 统计案例§3.1 独立性检验(1)一.问题情境5 月 31 日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了 515个成年人,其中吸烟者 220 人,不吸烟者 295 人.调查结果是:吸烟的 220 人中有 37 人患呼吸道疾病(简称患病),183 人未患呼吸道疾病(简称未患病);不吸烟的 295 人中有 21人患病,274 人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”?二.学生研究:为了研究这个问题,(1)引导学生将上述数据用下表来表示:患病未患病合计吸烟37183220不吸烟21274295合计58457515 (2)估计吸烟者与不吸烟者患病的可能性差异:在吸烟的人中,有的人患病,在不吸烟的人中,有的人患病.问题:由上述结论能否得出患病与吸烟有关?把握有多大?三.学习过程1.独立性检验: (1)假设:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下表:患病未患病合计吸烟不吸烟合计1 (2)卡方统计量:为了消除样本对上式的影响,通常用卡方统计量(χ2)来进行估计.卡方 χ2统计量公式: χ2(其中)说明:(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用 χ2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据取值越大,效果越好.在实际应用中,当均不小于 5,近似的效果才可接受.(2)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病”.(3)在假设下统计量 χ2应该很小,如果由观测数据计算得到 χ2的观测值很大,则在一定程度上说明假设不合理(即统计量 χ2越大,“两个分类变量有关系”的可能性就越大).2.独立性检验的一般步骤: 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值:类和类 (如吸烟与不吸烟),Ⅱ也有两类取值:类 和类 (如患呼吸道疾病与不患呼吸道疾病),得到如下表所示:Ⅱ类类合计Ⅰ类类 合计推断“Ⅰ和Ⅱ有关系”的步骤为:2第一步,提出假设:两个分类变量Ⅰ和Ⅱ没有关系;第二步,根据 2×2 列联表和公式计算 χ2统计量;第三步,查对课本中临界值表,作出判断.3...