独立性检验的基本思想及其初步应用 【学习目标】1. 了解独立性检验(只要求 2×2 列联表)的基本思想、方法及初步应用2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用.【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。(2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。要点二、2×2 列联表1. 列联表用表格列出的分类变量的频数表,叫做列联表。2. 2×2 列联表对于两个事件 A,B,列出两个事件在两种状态下的数据,如下表所示:事件 B事件合计事件 Aaba+b事件cdc+d合计a+cb +da+b+c+d这样的表格称为 2×2 列联表。要点三:卡方统计量公式为了研究分类变量 X 与 Y 的关系,经调查得到一张 2×2 列联表,如下表所示 Y1Y2合计X1aba+bX2cdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方”)统计量,它的表达式是: (为样本容量)。要点四、独立性检验1. 独立性检验通过 2×2 列联表,再通过卡方统计量公式计算的值,利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。2. 变量独立性的判断通过对统计量分布的研究,已经得到两个临界值:3.841 和 6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:① 如果≤3.841 时,认为事件 A 与 B 是无关的。② 如果>3.841 时,有 95%的把握说事件 A 与事件 B 有关;③ 如果>6.635 时,有 99%的把握说事件 A 与事件 B 有关;要点诠释:(1)独立性检验一般是指通过计算统计量的大小对两个事件是否有关进行判断;(2)独立性检验的基本思想类似于反证法。即在 H0:事件 A 与 B 无关的统计假设下,利用统计量的大小来决定在多大程度上拒绝原来的统计假设 H0,即拒绝“事件 A 与 B 无关”,从而认为事件 A 与 B 有关。独立性检验为假设检验的特例。(3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握...