3.2 第一课时 了解独立性检验的基本思想和实施步骤一、课前准备1.课时目标1.了解 2×2 列联表的定义;2.了解图形判断两个分类变量是否有关系的方法;3.能用已知 K2的观测值 k 判断两个分类变量是否有关系.2.基础预探1. 变量取不同的“值”表示个体所属不同类别,这样的变量称为________.分类变量2. 一般地,假设两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为 2×2 列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d 表示 A 取 A1,B 取 B1时的数据; 表示 A 取 A1,B 取 B2时的数据; 表示 A 取A2,B 取 B1时的数据; 表示 A 取 A2,B 取 B2时的数据.2.统计学家选取统计量2K ,其中 n=a+b+c+d 为 .3.利用 2×2 列联表得到2K 的观测值,可以来判断“两个分类变量“是否有关系.如果2K > ,就有 99%把握认为“X 与 Y 有关系”. 如果2K > ,就有 95%把握认为“X 与 Y 有关系”.如果2K > ,就有 90%把握认为“X 与 Y 有关系”.而如果2K ≤ ,就认为没有充分的证据显示“X 与 Y 有关系”. 1. x1,x2 y1,y2 a b c d2()()()()()n adbcab cdac bd 样本容量.3. 6.635 3.841 2.706 2.706 二、学习引领1.分类变量的深入理解分类变量中的“变量”和值都应作为“广义”的变量和值进行理解,例如:对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”.因此,这里所说的“变量”和值不一定取的是具体的数值.分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.2.两个变量是否独立的定性分析方法(1)频率分析:通过对样本的每个分类变量的不同类别的事件发生的频率大小比较来分析分类变量之间是否有关联关系.通常通过列联表列出两个分类变量的占少数表来进行分析.(2)图形分析① 三维柱形图,它可以清晰的看出各个频数的相对大小;② 二维条形图,可画叠在一起的二维条形图,也可以直观的展现各个频数的相对大小;③ 频率分布条形图:等高条形图表示两个变量的关系比二维条形图更清晰.三、利用图形判断两个分类变量是否有关系通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.1(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱...