回归分析的基本思想及其初步应用24/12/29郑平正制作3.1回归分析的基本思想及其初步应用(一)高二数学选修2-3两个变量的关系不相关相关关系函数关系线性相关非线性相关现实生活中两个变量间的关系:相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系.函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系函数关系是一种理想的关系模型相关关系在现实生活中大量存在,是更一般的情况ˆˆ,ab表示有一组具体的数据估计得到的截距和斜率;a,b,y表示真实值;ybxa表示由真实值a,b所确定的值.ˆˆˆybxa表示由估计值所确定的值.ˆˆ,ab1122211()()ˆˆ;()nniiiiiinniiiixxyyxynxybaybxxxxnx,21ˆ()niiiQyy2221122()()()nnybxaybxaybxa这种方法称为回归分析.两个具有线性相关关系的变量的统计分析:(1)画散点图;(2)求回归直线方程(最小二乘法):(3)利用回归直线方程进行预报;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.ˆˆˆybxa121()()ˆ()niiiniixXyYbxXˆaYbX(,)XY为样本点的中心样本点:1122(,),(,),...,(,)nnxyxyxy2008年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用.“身高标准体重”从何而来?我们怎样去研究?创设情境:某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.体重010203040506070150155160165170175180身高体重体重解:取身高为解释变量x,体重为预报变量y,作散点图:样本点呈条状分布,身高和体重有较好的线性相关关系,因此可以用回归方程来近似的刻画它们之间的关系.121()()ˆ()niiiniixXyYbXXˆaYbX由得:ˆˆ0.849,85.712ba故所求回归方程为:ˆ0.84985.712yx因此,对于身高172cm的女大学生,由回归方程可以预报其体重为:ˆ0.84917285.71260.316()ykgˆ0.849b是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.849个单位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?相关系数相关系数的性质(1)|r|≤1.(2)|r|越接近于1,相关程度越强;|r|越接近于0,相关程度越弱.•注:b与r同号•问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?122122211121()()(())())(niiinniiiiniiinniiiixynxxyxyxnxynyyxxyyr相关系数r>0正相关;r<0负相关.通常:r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;对r进行显著性检验122122211121()()(())())(niiinniiiiniiinniiiixynxxyxyxnxynyyxxyyr某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.故所求回归方程为:ˆ0.84985.712yxr=0.798表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的.ˆ0.84917285.71260.316()ykg认为她的平均体重的估计值是60.316kg.因为所有的样本点不共线,所以线性函数模型只能近似地刻画身高和体重之间的关系,即:体重不仅受身高的影响,还受其他因素的影响,把这种影响的结果用e来表示,从而把线性函数模型修改为线性回归模型:y=bx+a+e.其中,e包含体重不能由身高的线性函数解释的所有部分.线性回归模型yabxe其中a和b为模型的未知参数,e是y与之间的误差,通常e为随机变量,称为随机误差.ybxa均值E...