2 第一课时 了解独立性检验的基本思想和实施步骤一、课前准备1
了解 2×2 列联表的定义;2
了解图形判断两个分类变量是否有关系的方法;3
能用已知 K2的观测值 k 判断两个分类变量是否有关系
变量取不同的“值”表示个体所属不同类别,这样的变量称为________
一般地,假设两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为 2×2 列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d 表示 A 取 A1,B 取 B1时的数据; 表示 A 取 A1,B 取 B2时的数据; 表示 A 取A2,B 取 B1时的数据; 表示 A 取 A2,B 取 B2时的数据
统计学家选取统计量2K ,其中 n=a+b+c+d 为
利用 2×2 列联表得到2K 的观测值,可以来判断“两个分类变量“是否有关系
如果2K > ,就有 99%把握认为“X 与 Y 有关系”
如果2K > ,就有 95%把握认为“X 与 Y 有关系”
如果2K > ,就有 90%把握认为“X 与 Y 有关系”
而如果2K ≤ ,就认为没有充分的证据显示“X 与 Y 有关系”
x1,x2 y1,y2 a b c d2()()()()()n adbcab cdac bd 样本容量
706 二、学习引领1
分类变量的深入理解分类变量中的“变量”和值都应作为“广义”的变量和值进行理解,例如:对于性别变量,其取值为男和女两种
那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”
因此,这里所说的“变量”和值不一定取的是具体的数值
分类变量是大量存在的,例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类