高二数学学案(选修2-3)第三章审稿人:高二数学组13.1回归分析的基本思想及其初步应用学习目标:1.能知道用回归分析处理两个变量之间的不确定关系的统计方法2.会利用散点图分析两个变量是否存在相关关系.会利用残差及2R来刻画线性回归模型的拟合效果3.能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型学习重点:建立变量之间的线性回归方程,能根据散点图初步判断两个变量之间是否具有线性关系学习难点:1.会求线性回归方程2.掌握建立回归模型的步骤,会选择回归模型,特别是非线性回归模型学习过程:一、知识探究1.回归分析(1)函数关系是一种关系,而相关关系是一种关系(2)回归分析是对具有关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关关系的数据,,,,2211yxyx⋯nnyx,,回归直线axby的斜率和截距的最小二乘估计公式分别为:b=,a其中xy,称为样本点的中心(4)相关系数r:衡量两个变量之间线性关系的强弱计算公式:r=注:①0r时,表明两个变量相关;0r时,表明两个变量相关②r越接近于,表明两个变量线性相关性越强r越接近于,表明两个变量之间几乎不存在线性相关关系高二数学学案(选修2-3)第三章审稿人:高二数学组22.线性回归模型在线性回归模型eabxy(其中ba和为模型的未知参数)中,e称为,自变量x称为,因变量y称为探究:①产生随机误差的原因②线性回归模型与一次函数的不同3.残差(1)定义:在回归分析中,对应于样本点,,,,2211yxyx⋯nnyx,的随机误差),,2,1(niei的估计值称为相应于点iiyx,的(2)残差图:以为横坐标,为纵坐标作出的图形称为残差图.注:残差图是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高(3)残差分析:在研究两个变量间的关系时,首先要根据来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,通过残差来判断模型拟合的效果,判断原始数据中是否存在,这方面的分析工作称为残差分析4.相关指数2R相关指数2R可以用来刻画回归的效果,其计算公式是2R=在线性回归模型中,2R越大,意味着残差平方和niiiyy12越小,即模型的拟合效果,2R越小,意味着残差平方和越大,即模型的拟合效果注:在含有一个解释变量的线性回归模型中,2R恰好等于相关系数r的平方高二数学学案(选修2-3)第三章审稿人:高二数学组35.非线性回归方程当回归方程不是形如Rbaabxy,时,称之为,非线性回归方程也可以(1)将幂函数型函数naxy(a为常数,yxa,,均取正值)化为线性函数:将naxy两边取常用对数,则有,令abxylg,lg,lg代入上式得(其中bn,是常数),其图象是一条直线(2)将指数型函数xcay(caca,,0,0为常数,且0a)化为线性函数:将xcay两边取常用对数,则有,令adcbylg,lg,lg代入上式得(其中bd,是常数),其图象是一条直线6.建立回归模型的基本步骤:(1)确立研究对象,明确哪个变量是,那个变量是(2)画好确定好的解释变量和预报变量的,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在差异,则检验数据是否有误,或模型是否合适等注:有关回归方程需要注意下列问题①回归方程只适用于我们所研究的样本的总体②我们所建立的回归方程一般都有时间性③样本取值的范围会影响回归方程的适用范围④不能期望回归方程得到的预报值就是预报变量的精确值二、理论迁移例1:(1)如果记录了yx,的几组数据分别为),10,3(),7,2(),4,1(),1,0(则y关于x的线性回归直线必过点()高二数学学案(选修2-3)第三章审稿人:高二数学组4A.)2,2(B.)2,15(C.)2,1(D.)5.5,5.1((2)下列四个命题中正确是()①在线性回归模型中,+ebxa是预报真实值y的随机误差,它是一个观测的量;②残差平方和越小的模型,拟合的效果越好;③用2R来刻画回归方程,2R越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域...