3.2独立性检验的基本思想及其初步应用剑川县民族中学梁雪兰[教学目标]1
了解分类变量的意义,会制作2×2列联表(重点).2
了解随机变量K2的含义以及观测值k的计算公式(重点).3
通过对典型案例分析,了解独立性检验的基本思想和方法(重点、难点).[知识提炼·梳理]1.分类变量和列联表(1)分类变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表.①定义:两个分类变量的频数表称为列联表.②2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为2×2列联表)如下表所示:分类y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d注意:列联表中的数据是样本数据,具有随机性,所以,独立性检验的结果只能说成立的概率有多大,而不能完全肯定一个结论.2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频数特征
(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.[思考尝试·夯基]1.思考判断(正确的打“√”,错误的打“×”).(1)K2独立性检验的统计假设是各事件之间相互独立.()(2)K2独立性检验显示“患慢性气管炎和吸烟习惯有关”,这就是指“有吸烟习惯的人必定会患慢性气管炎”.()(3)2×2列联表中的4个数据可以是任意正数.()解析:(1)对,由独立性检验的检验步骤可知该说法正确.(2)错,K2独立性检验显示“患慢性气管炎和吸烟习惯有关”,是指有一定的把握说他们相关,或者说有一定的出错率.(3)错,2×2列联表中的4个数据是对于某组特定数据的统计数据,故四个数据间有一定的关系.答案:(1)√(2)×(3)×2.在2×2列联表中,下列哪两个比值相差越大,两个分类变量之间的关系越强()A