2 独立性检验的基本思想及其初步应用自主预习·探新知情景引入饮用水的质量是人类普遍关心的问题.据统计,饮用优质水的 518 人中,身体状况优秀的有 466 人,饮用一般水的 312 人中,身体状况优秀的有 218 人,人的身体健康状况与饮用水的质量之间有关系吗
新知导学1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的__不同类别__,像这样的变量称为分类变量.(2)列联表:① 定义:列出的两个分类变量的__频数表__称为列联表.②2×2 列联表.一般地,假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2
等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否__相互影响__,常用等高条形图表示列联表数据的__频率特征__.(2)观察等高条形图发现____和____相差很大,就判断两个分类变量之间有关系.3.独立性检验定义利用随机变量 K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=,其中 n=__a + b + c + d __具体步骤① 确定 α,根据实际问题的需要,确定允许推断“两个分类变量有关系”犯错误概率的上界 α,然后查表确定__临界值 K 0__.② 计算 K2,利用公式计算随机变量 K2的__观测值 k __.③ 下结论,如果__k ≥ K 0__,就推断“X 与 Y 有关系”,这种推断__犯错误的概率__不超过 α;否则,就认为在犯错误的概率不超过 α 的前提下不能推断“X 与 Y 有关系”,或者在样本数据中__没有发现足够证据__支持结论“X 与Y 有关系”预习自测1.如下是一个 2×2 列联表,则表中 m,n 的值分别为( B )y1y2总计x1a3545x2