第三章 统计案例3.1 回归分析的基本思想及其初步应用[目标] 1.了解随机误差、残差、残差分析的概念.2.会用残差分析判断线性回归模型的模拟效果.3.通过典型案例的探究,了解非线性模型通过变换可以转化为线性回归模型的思想.[重点] 建立变量之间的线性回归方程,能根据散点图初步判断两个变量之间是否具有线性关系.[难点] 1.会求线性回归方程.2.掌握建立回归模型的步骤,会选择回归模型,特别是非线性回归模型.知识点一 线性回归模型[填一填]1.回归方程的相关计算对于两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn).设其回归直线方程为 y=bx+a,其中 a,b 是待定参数,由最小二乘法得b ==,a =-b .其中=,=,a ,b 分别是 a,b 的估计值.(,)称为样本点的中心.2.线性回归模型(1)线性回归模型其中 a,b 为未知参数,通常 e 为随机变量,称为随机误差.(2)x 称为解释变量,y 称为预报变量.[答一答]1.yi,y i,相同吗?试说明缘由.提示:不相同.yi是样本点(xi,yi)的纵坐标;是样本点的中心(,)的纵坐标;y i是 yi的估计值.2.回归分析中,利用线性回归方程求出的函数值是否一定为真实值?提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值.例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食、是否喜欢运动等.3.线性回归方程能否用散点图中的某两点来确定?提示:不能用散点图中过某两点的直线方程来作为线性回归方程.由散点图易发现,样本点散布在某一条直线附近,而不是一条直线上,不能用一次函数 y=bx+a 描述它们之间的关系,因此用线性回归模型 y=bx+a+e 来表示,其中 a,b 的最小二乘法估计分别为a ,b .知识点二 线性回归分析[填一填]1.残差对于样本点(xi,yi)(i=1,2,…,n)的随机误差的估计值e i=yi-y i称为相应于点(xi,yi)的残差,称为残差平方和.2.残差图利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,也可用其他测量值,这样作出的图形称为残差图.3.相关指数 R2=1-,R2越接近于 1,表示回归效果越好.[答一答]4.有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义.用残差能否判断建立的回归模型是否合理?提示:残差能对 x,y 的线性相关性进行检验.残差可...