独立性检验的基本思想及其初步应用 【学习目标】1
了解独立性检验(只要求 2×2 列联表)的基本思想、方法及初步应用2
通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用
【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量
要点诠释:(1)对分类变量的理解
这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解
例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”
因此,这里所说的“变量”和“值”取的不一定是具体的数值
(2)分类变量可以有多种类别
例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别
要点二、2×2 列联表1
列联表用表格列出的分类变量的频数表,叫做列联表
2×2 列联表对于两个事件 A,B,列出两个事件在两种状态下的数据,如下表所示:事件 B事件合计事件 Aaba+b事件cdc+d合计a+cb +da+b+c+d这样的表格称为 2×2 列联表
要点三:卡方统计量公式为了研究分类变量 X 与 Y 的关系,经调查得到一张 2×2 列联表,如下表所示 Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是: (为样本容量)
要点四、独立性检验1
独立性检验通过 2×2 列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验
变量独立性的判断通过对统计量分布的研究,已经得到两个临界值:3
841 和 6
当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:① 如果≤3
841 时,认为事件 A 与 B 是无关的
② 如果>3