3.1 回归分析的基本思想及其初步应用预习导航课程目标学习脉络1.能知道用回归分析处理两个变量之间的不确定关系的统计方法.2.会利用散点图分析两个变量是否存在相关关系.会用残差及 R2来刻画线性回归模型的拟合效果.3.能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型.1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线 y=bx+a的斜率和截距的最小二乘估计公式分别为b==,a =-b ,其中,(,)称为样本点的中心.思考 1 如果记录了 x,y 的几组数据分别为(0,1),(1,3),(2,5),(3,7),则 y 关于 x 的线性回归直线必过点( )A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)提示: ==1.5,==4,∴样本点的中心为(1.5,4),而回归直线过样本点的中心.2.随机误差(1)随机误差的均值 E(e)=0,方差 D(e)=σ 2 > 0 .(2)线性回归模型的完整表达式为在线性回归模型中,随机误差 e 的方差 σ2越小,用 bx+a 预报真实值 y 的精度越高.(3)对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为 ei= y i- bx i- a , i = 1,2 ,…, n ,其估计值为ei = y i- yi = y i- b x i- a , i = 1,2 ,…, n,e i称为相应于点(xi,yi)的残差.(4)以样本编号为横坐标,残差为纵坐标作出的图形称为残差图.(5)我们可以用相关指数 R2来刻画回归的效果,其计算公式是 R 2 = 1 - .(6)R2越大,意味着残差平方和∑ (yi-yi)2越小,也就是说,模型拟合的效果越好.思考 2 如何刻画回归模型拟合效果?提示:类别残差图法残差平方和法R2法特点残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和(yi-yi)2越小,模型的拟合效果越好R2=1-2121niiiniiyyyy表示解释变量对于预报变量变化的贡献率,R2越接近于 1,表示回归的效果越好3.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).1(3)由经验确定回归方程的类型(如观察到数据呈线性...