【三维设计】2015-2016 学年高中数学 第一章 统计案例学案 新人教A 版选修 1-2_1.1 回归分析的基本思想及其初步应用 线性回归方程[导入新知]1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.2.线性回归模型(1)线性回归模型 y=bx + a + e ,其中 a 和 b 是模型的未知参数,e 称为随机误差.自变量 x 称为解释变量,因变量 y 称为预报变量.(2)在回归方程y=bx+a中,b==,a=-b.其中=i,=i, (,)称为样本点的中心.[化解疑难]线性回归方程中系数b的含义1(1)b是回归直线的斜率的估计值,表示 x 每增加一个单位,y 的平均增加单位数,而不是增加单位数.(2)当b>0 时,变量 y 与 x 具有正的线性相关关系;当b<0 时,变量 y 与 x 具有负的线性相关关系.线性回归分析[导入新知]1.残差分析(1)残差:样本点(xn,yn)的随机误差 ei=yi- bx i- a ,其估计值为ei=yi-yi=yi-bxi-a,ei称为相应于点(xi,yi)的残差(residual).(以上 i=1,2,…,n)(2)残差图:作图时,纵坐标为残差,横坐标可以选为样本编号,或 xi数据,或 yi数据,这样作出的图形称为残差图.(3)残差分析:残差分析即通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果,其步骤为:计算残差——画残差图——在残差图中分析残差特性.残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.2.相关指数我们可以用相关指数 R2来刻画回归的效果,其计算公式是:R2=1-.R2越大,残差平方和(yi-yi)2越小,即模型的拟合效果越好;R2越小,残差平方和(yi-yi)2越大,即模型的拟合效果越差.在线性回归模型中,R2的取值范围为[0,1],R2表示解释变量对于预报变量变化的贡献率,1-R2表示随机误差对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好.[化解疑难]残差分析的注意点在残差图中,可疑数据的特征表现为:(1)个别样本点的残差过大,即大多数的残差点比较均匀地落在水平的带状区域中,而个别残差点偏离该区域过于明显,需要确认在采集这些样...