课题导入前面我们已经初步学习了线性回归分析这节课我们继续来对回归模型的建立和分析做一些探讨本节课我们将介绍相关知识目标引领了解随机误差、残差、残差分析的概念;会用残差分析判断线性回归模型的拟合效果;掌握建立回归模型的步骤;通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.回归分析回归分析是对具有_________的两个变量进行统计分析的一种常用方法.线性回归模型(1)由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数y=bx+a描述它们之间的关系,因此用线性回归模型y=bx+a+e来表示,其中a、b为未知参数,e为_________.1.2.相关关系随机误差独立自学刻画回归效果的方式3.残差残差图利用图形来分析残差特性,作图时纵坐标为_____,横坐标可以选为_________,或_________,或___________等,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高数据点和它在回归直线上相应位置的差异(yi-y^i)是随机误差.称e^i=yi-y^i为残差,e^i称为相应于点(xi,yi)的残差.i=1n(yi-y^i)2称为残差平方和样本编号身高数据残差体重估计值残差平方和残差平方和为__________,残差平方和_____,模型拟合效果越好相关指数R2越小R2=1-i=1nyi-y^i2i=1nyi-y-2,R2表示_____变量对_____变量变化的贡献率,R2越接近于1,表示回归的效果越好解释预报i=1n(yi-y^)2为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:【例1】x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求线性回归方程;(2)求出R2;(3)进行残差分析.[思路探索]作残差分析时,一般从以下几个方面予以说明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样本点的带状分布区域的宽窄.引导探究[自主解答](1)散点图如图x-=16(5+10+15+20+25+30)=17.5,y-=16(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,i=16x2i=2275,i=16xiyi=1076.20.050.005-0.08-0.0450.040.025-2.24-1.37-0.540.411.412.31计算得,b^≈0.183,a^≈6.285,所求回归直线方程为y^=0.183x+6.285.(2)列表如下:yi-y^iyi-y-所以i=16(yi-y^i)2≈0.01318,i=16(yi-y-)2=14.6784.所以,R2=1-0.0131814.6784≈0.9991,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.规律方法当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面.下表为收集到的一组数据:【例2】x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.审题指导(1)画出散点图或进行相关性检验,确定两变量x、y是否线性相关.由散点图得x、y之间的回归模型.(2)进行拟合,预报回归模型,求回归方程.[规范解答](1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1、c2为待定的参数.(4分)(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,(a=lnc1,b=c2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为z^=0.272x-3.849,∴y^=e0.272x-3.849.(8分)残差yi7112124661153256.44311.10119.12532.95056.770128.381290.3250.557-0.1011.875-8.9509.23-13.38134.675y^ie^i(10分)(3)当x=40时,y=e0.272x-3.849≈1131...