1.2 预习课本 P10~15,思考并完成以下问题1.分类变量与列联表分别是如何定义的? 2.独立性检验的基本思想是怎样的? 3.独立性检验的常用方法有哪些? 1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:① 列出的两个分类变量的频数表, 称为列联表.② 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d在 2×2 列联表中,如果两个分类变量没有关系,则应满足 ad-bc≈0, 因此|ad-bc|越小, 关系越弱; |ad-bc|越大, 关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量 K 2 来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=,其中 n=a + b + c + d 为样本容量.1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.( )(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系, 而独立性检验中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )(3)独立性检验的方法就是反证法.( )答案:(1)× (2)√ (3)×2.与表格相比,能更直观地反映出相关数据总体状况的是( )A.列联表 B.散点图C.残差图 D.等高条形图答案:D3.如果有 99%的把握认为“X 与 Y 有关系”,那么具体算出的数据满足( )附表:P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828A.k>6.635 B.k>5.024C.k>7.879 D.k>3.841答案:A4.下面是一个 2×2 列联表:y1y2总计x1a2173x222527总计b46100则表中 a,b 的值分别为________.答案:52, 54等高条形图的应用[典例] 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?[解] 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的...