§1.1 回归分析的基本思想及其初步应用学习目标 1.了解回归分析的必要性及其一般步骤.2.了解随机误差的概念.3.会作散点图,并会求线性回归方程.4.利用残差分析来判断线性回归模型的拟合效果.5.掌握建立回归模型的基本步骤,并通过实例进一步学习回归分析的基本思想及其初步应用.知识点一 回归分析的相关概念思考 1 相关关系是确定性关系吗?函数关系呢?答案 相关关系是一种非确定性关系,而函数关系是一种确定性关系.思考 2 请问产生随机误差的主要原因有哪些?答案 (1)所选用的模型不恰当;(2)忽略了某些因素的影响;(3)存在测量误差.梳理 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析.(2)线性回归方程为y=bx+a,且b=,a=-b,其中=i,=i,(,)称为样本点的中心,回归直线一定过样本点的中心.(3)样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数 y=bx+a来描述它们之间的关系,而是用线性回归模型 y = bx + a + e 来表示,其中 a 和 b 为模型的未知参数,e 称为随机误差,自变量 x 称为解释变量,因变量 y 称为预报变量.预报变量 y 的值由解释变量 x 和随机误差 e 共同确定,即解释变量 x 只能解释部分预报变量y 的变化.知识点二 回归模型的模拟效果思考 如何评价回归模型拟合效果的优劣?答案 计算相关指数 R2的值,R2越接近于 1,效果就越好.梳理 残差把随机误差的估计值ei称为相应于点(xi,yi)的残差残差图作图时纵坐标为残差,横坐标可以选为样本编号,或解释变量的数值,这样作出的图形称为残差图残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高残差平方和残差平方和为(yi-yi)2,残差平方和越小,模型的拟合效果越好相关指数 R2R2=1-,R2表示解释变量对于预报变量变化的贡献率,R2越接近于 1,表示回归的效果越好1.回归方程y=bx+a中的b表示当 x 每增加一个单位时,y的变化量.( √ )2.R2越大,残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.( √ )3.散点图是判断两个变量是否有相关关系的工具之一.( √ )4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的...