独 立 性 检 验情境引入 “ 南咸北甜”的说法由来已久,那么,南北地域差异与偏好粽子咸甜之间到底有无关联呢?为此,某高校随机抽查了 500 名学生,得到的数据如下表:偏好咸粽偏好甜粽南方学生123105北方学生124148A B偏好咸粽(B1)偏好甜粽(B2)总计南方学生(A1)123105228北方学生(A2)124148272总计247253500问题一 : 请根据表中数据直观判断二者有无关联。问题二 : 请通过一定的数据分析支撑你的判断。A BB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d问题三 : 假设分类变量 A 与 B 没有关联,即 A1 与B1 、 A1 与 B2 、 A2 与 B1 、 A2 与 B2 相互独立,能得到什么结论?-0a ab acnnn ;-0c cd acnnn ;-0b ab bdnnn ;-0d cd bdnnn ;问题四:用一个什么量来刻画这种差异呢? 皮尔逊 (Karl Pearson,1857 —1936),英国统计学家 , 数理统计学的创立者 . 抽象概括1900 年,皮尔逊发表了一个著名的统计量,称之为卡方( χ2 ),用以测定观察值与期望值之间的差异显著性。χ2 统计量+化简得:=2问题五 : 根据卡方的表达式,请你说说卡方的大小和两个变量之间关联程度的强弱有何关系?卡方越小,独立性越强,相关性越弱;卡方越大,独立性越弱,相关性越强。=2临界值表210.828 =0.001P 例如:()统计学研究发现:假设 A 与 B 相互独立,则出现 的概率只有千分之一,这是一个小概率事件,几乎不可能发生 .828.102 假设检验法0.500.400.50.150.100.050.0250.0100.0050.001k0.4450.7081.3232.0722.7063.8415.0246.6357.87910.8282()Pk 独立性检验临界值表的应用1% 把握认为 A 与 B 无关99% 把握认 A 与 B 有关5% 把握认为 A 与 B 无关95% 把握认为 A 与 B 有关10% 把握认为 A 与 B 无关90% 把握认为 A 与 B 有关没有充分的依据显示 A 与 B 有关,可以认为 A 与 B 没有关联84132.70622.22.706 63562.0.500.400.50.150.100.050.0250.0100.0050.001k0.4450.7081.3232.0722.7063.8415.0246.6357.87910.8282()Pk A B偏好咸粽(B1)偏好甜粽(B2)总计南方学生(A1)123105228北方学生(A2)124148272总计24725350022500123 148-105 124=3.4672.706228 272 247 253答案:,所以有 90 %的把握认为南北地域与偏好粽子咸甜有关。例 1.典例精讲...