2 独立性检验的基本思想及其初步应用[教材研读]预习教材 P91~96,思考以下问题1.分类变量与列联表分别是如何定义的
2.独立性检验的基本思想是怎样的
[要点梳理]1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:① 列出的两个分类变量的频数表,称为列联表.② 一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为:YXy1y2总计x1aba + b x2cdc + d 总计a + c b + d a+b+c+d2
等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量 K 2 来判断“两个分类变量有关系\”的方法称为独立性检验.(2)公式:K2=,其中 n=a + b + c + d
(3)独立性检验的具体做法:① 根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 α,然后查表确定临界值 k0
② 利用公式计算随机变量 K2的观测值 k
③ 如果 k ≥ k 0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 α;否则,就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与 Y 有关系”.[自我诊断]判断(正确的打“√”,错误的打“×”)1.分类变量中的变量与函数中的变量是同一概念.( )2.列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )3.独立性检验的方法就是反证法.( )[答案] 1
×题型一 用等