1 回归分析的基本思想及其初步应用预习导航课程目标学习脉络1.能知道用回归分析处理两个变量之间的不确定关系的统计方法.2.会利用散点图分析两个变量是否存在相关关系.会用残差及 R2来刻画线性回归模型的拟合效果.3.能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型.1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线 y=bx+a的斜率和截距的最小二乘估计公式分别为b==,a =-b ,其中,(,)称为样本点的中心.思考 1 如果记录了 x,y 的几组数据分别为(0,1),(1,3),(2,5),(3,7),则 y 关于 x 的线性回归直线必过点( )A.(2,2) B.(1
5,2) C.(1,2) D.(1
5,4)提示: ==1
5,==4,∴样本点的中心为(1
5,4),而回归直线过样本点的中心.2.随机误差(1)随机误差的均值 E(e)=0,方差 D(e)=σ 2 > 0
(2)线性回归模型的完整表达式为在线性回归模型中,随机误差 e 的方差 σ2越小,用 bx+a 预报真实值 y 的精度越高.(3)对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为 ei= y i- bx i- a , i = 1,2 ,…, n ,其估计值为ei = y i- yi = y i- b x i- a , i = 1,2 ,…, n,e i称为相应于点(xi,yi)的残差.(4)以样本编号为横坐标,残差为纵坐标作出的图形称为残差图.(5)我们可以用相关指数 R2来刻画回归的效果,其计算公式是 R 2 = 1 -
(6)R2越大,意味着残