2 预习课本 P10~15,思考并完成以下问题1.分类变量与列联表分别是如何定义的
2.独立性检验的基本思想是怎样的
3.独立性检验的常用方法有哪些
1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:① 列出的两个分类变量的频数表, 称为列联表.② 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d在 2×2 列联表中,如果两个分类变量没有关系,则应满足 ad-bc≈0, 因此|ad-bc|越小, 关系越弱; |ad-bc|越大, 关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响, 常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量 K 2 来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=,其中 n=a + b + c + d 为样本容量.1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.( )(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系, 而独立性检验中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )(3)独立性检验的方法就是反证法.( )答案:(1)× (2)√ (3)×2.与表格相比,能更直观地反映出相关数据总体状况的是( )A.列联表 B.散点图C.残差图 D.等高条形图答案:D3.如果有 99%的把握认为“X 与 Y 有关系”,那么具体算出的数据满足( )附表:P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0