3.2 独立性检验的基本思想及其初步应用[教材研读]预习教材 P91~96,思考以下问题1.分类变量与列联表分别是如何定义的? 2.独立性检验的基本思想是怎样的? [要点梳理]1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:① 列出的两个分类变量的频数表,称为列联表.② 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为:YXy1y2总计x1aba + b x2cdc + d 总计a + c b + d a+b+c+d2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量 K 2 来判断“两个分类变量有关系\”的方法称为独立性检验.(2)公式:K2=,其中 n=a + b + c + d .(3)独立性检验的具体做法:① 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 α,然后查表确定临界值 k0.② 利用公式计算随机变量 K2的观测值 k.③ 如果 k ≥ k 0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 α;否则,就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与 Y 有关系”.[自我诊断]判断(正确的打“√”,错误的打“×”)1.分类变量中的变量与函数中的变量是同一概念.( )2.列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )3.独立性检验的方法就是反证法.( )[答案] 1.× 2.√ 3.×题型一 用等高条形图分析两个分类变量间的关系 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?[思路导引] 依据表中数据,画出等高条形图,由图形进行分析.[解] 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异...