第三章统计案例3.1回归分析的基本思想及其初步应用假设某地区从2003年到2012年的人均GDP(单位:美元)数据如表:能否根据提供的数据建立一个合适的模型,预报2014年(或2015年)的人均GDP是多少?年份人均GDP200312002004151020051870200622102007257020083000200936702010450020115430201261001.通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别.(重点)2.尝试作散点图,求回归直线方程.(重点)3.能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断回归模型拟合好坏的方法——相关指数和残差分析.(重点、难点)探究点1回归分析的基本思想我们知道,函数关系是一种确定性关系,而相关关系是一种非确定性关系.回归分析(regressionanalysis)是对具有相关关系的两个变量进行统计分析的一种常用方法.在之前的学习中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为画散点图,求回归直线方程,并用回归直线方程进行预报.1122nnx,y,x,y,,x,y,对于一组具有线性相关关系的数据我们知道其回归直线y=bx+a的斜率和截距的最小二乘估计分别为1,ˆ121niiniiixxyyxxbˆˆaybx,2nniii1i111xx,yy.x,ynn.?其中称为样本点的中心你能推导出这两个计算公式吗n2iii1ˆˆ,abQ,yx,.从已经学过的知识我们知道截距和斜率分别是使取最小值时的值niiixyxyxyQ12,由于n2iiiii12yxyx2yxyxyxyxnn2iiiii1i12yxyx2yxyxyxnyx,xyxyxyniii1niiixyxyxy1nniii1i1yxyxnyxyxnynxnyx0,212,xynxyxyQniii所以注意到nn22iiii1i1n22ii1xx2xxyyyynyx2niin22i1in2i1ii1xxyynyxxxxx.121221niiniiniiiyyxxyyxx在上式中,后两项和α,β无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0,即取.,121xyxxyyxxniiniii.这正是我们所要推导的公式下面我们通过案例,进一步学习回归分析的基本思想及其应用.31例1从某大学中随机选取8名女大学生,其身高和体重数据如表所示.-5943616454505748kg/170155165175170157165165cm/87654321体重身高编号求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y.作散点图(图3.1解:-1):31表-图3.1-1从图3.1-1中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y=bx+a来近似刻画它们之间的关系.身高/cm体重/kg12ˆˆb0.849a85.712.ˆy0.84985.712.x根据探究中的公式()和(),可以得到,于是得到回归方程ˆb=0.849是回归直线的斜率的估计值,说明身高x每增加1个单位,体重y就增加0.849个单位,这表明体重与身高具有正的线性相关关系.为身高172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解释一下思考:原因吗?ˆ所以,对身高为172cm的女大学生,由回归方程可以预报其体重为y=0.849172-85.712=60.316(kg).在显然,身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重60.316kg左右.图3.1-2中的样本点和回归直线的相互位置说明了这一点.体重/kg从散点图中还看到,样本点散布在某一条直线...