章末复习课[整合·网络构建][警示·易错提醒]1.线性回归方程中的系数及相关指数R2,独立性检验统计量K2公式复杂,莫记混用错.2.相关系数r是判断两随机变量相关强度的统计量,相关指数R2是判断线性回归模型拟合效果好坏的统计量,而K2是判断两分类变量相关程度的量,应注意区分.3.在独立性检验中,当K2≥6
635时,我们有99
9%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%而不是两分类变量有关系的概率为99%
专题一回归分析思想的应用回归分析是对抽取的样本进行分析,确定两个变量的相关关系,并用一个变量的变化去推测另一个变量的变化.如果两个变量非线性相关,我们可以通过对变量进行变换,转化为线性相关问题.[例1]下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2008—2014
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0
01),预测2018年我国生活垃圾无害化处理量.附注:参考数据:yi=9
32,tiyi=40
1参考公式:相关系数r=,回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:b=,a=y-bt
解:(1)由折线图中数据和附注中参考数据得t=4,(ti-t)2=28,=0
55,(ti-t)(yi-y)=tiyi-tyi=40
17-4×9
89,r≈≈0
因为y与t的相关系数近似为0
99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由y=≈1
331及(1)得b==≈0
10,a=y-bt=1
10×4≈0
所以y关于t的回归方程为y=0
将2018年对应的t=11代入回归方