第三章统计案例3
2独立性检验的基本思想及其初步应用1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的__________,像这样的变量称为分类变量.(2)列联表:①定义:列出的两个分类变量的________称为列联表.②2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为1y2y总计1xabab2xcdcd总计acbdabcd从22列表中,依据bab与ccd的值可直观得出结论:两个变量是否有关系
2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否__________,常用等高条形图表示列联表数据的__________.(2)观察等高条形图发现__________和__________相差很大,就判断两个分类变量之间有关系.3.独立性检验定义利用随机变量2K来判断“两个分类变量有关系”的方法称为独立性检验公式22()()()()()nadbcKabcdacbd,其中n___________为样本容量
1具体步骤①确定a,根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定________.②计算2K,利用公式计算随机变量2K的观测值为________.③下结论,如果_________,就推断“X与Y有关系”,这种推断_____________不超过;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中___________________支持结论“X与Y有关系”参考答案1.(1)不同类别(2)频数表2.(1)相互影响频率特征(2)aabccd3.abcd①临界值0k0k②③观测值0kk犯错误的概率没有发现足够证据重点了解分类变量的意义,会