第三章 统计案例章末复习课 [整合·网络构建] [警示·易错提醒]1.线性回归方程中的系数及相关指数 R2,独立性检验统计量 K2公式复杂,莫记混用错.2.相关系数 r 是判断两随机变量相关强度的统计量,相关指数 R2是判断线性回归模型拟合效果好坏的统计量,而 K2是判断两分类变量相关程度的量,应注意区分.3.在独立性检验中,当 K2≥6.635 时,我们有 99.9%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为 99%而不是两分类变量有关系的概率为 99%.专题一 回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.[例 1] 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码 1~7 分别对应年份 2008—2014.(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2018 年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.参考公式:相关系数 r=,回归方程y=a+bt 中斜率和截距的最小二乘估计公式分别为:b=,a=y-bt.解:(1)由折线图中数据和附注中参考数据得t=4,(ti-t)2=28, =0.55,(ti-t)(yi-y)=tiyi-tyi=40.17-4×9.32=2.89,r≈≈0.99.因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系.(2)由 y=≈1.331 及(1)得b==≈0.10,a=y-bt=1.331-0.10×4≈0.93.所以 y 关于 t 的回归方程为y=0.93+0.10t.将 2018 年对应的 t=11 代入回归方程得y=0.93+0.10×11=2.03.所以预测 2018 年我国生活垃圾无害化处理量约为 2.03 亿吨.归纳升华解决回归分析问题的一般步骤1.画散点图.根据已知数据画出散点图.2.判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系.在此基础上,利用最小二乘法求回归系数,然后写出回归方程.3.实际应用.依据求得的回归方程解决问题.[变式训练] 近年来,随着以煤炭为主的能源消耗大幅攀升、机动车持有量急剧增加,某市空气中的 PM2.5(直径小于等于 2.5 微米的颗粒物)的含量呈逐年上升的趋势,如图是根...