2独立性检验的基本思想及其初步应用(一)高二数学选修2-3第三章统计案例2定量变量——回归分析(画散点图、相关系数r、变量相关指数R、残差分析)分类变量——研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等
变量分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等
两种变量:独立性检验本节研究的是两个分类变量的独立性检验问题
在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系
性别是否对于喜欢数学课程有影响
吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大
28%探究不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计98749199651、列联表2、三维柱形图3、二维条形图不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000从三维柱形图能清晰看出各个频数的相对大小
从二维条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例
通过图形直观判断两个分类变量是否相关:不吸烟吸烟00
91不吸烟吸烟患肺癌比例不患肺癌比例4、等高条形图等高条形图更清晰地表达了两种情况下患肺癌的比例
上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢
这需要用统计观点来考察这个问题
现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,为此先假设H0:吸烟与患肺癌没有关系