数学:1.1《回归分析》课件PPT(北师大版选修1-2)回归分析5.1概述回归分析——研究变量与变量之间关系的数学方法。变量之间的关系:5.1.1确定性关系函数关系,经反复的精确试验或严格的数学推导得到。如S=vt﹒。数学分析和物理学中的大多数公式属于这种类型。到方差分析实际问题中,绝大多数情况下,变量之间的关系不那么简单。如材料的抗拉强度与其硬度之间的关系;材料的性能与其化学成份之间等等。这些变量之间既存在着密切的关系,又不能由一个(或几个)变量(自变量)的数值精确地求出另一个变量(因变量)的数值,而是要通过试验和调查研究,才能确定它们之间的关系,如图5.1所示,虽然各组数据不是准确地服从f(x)关系,但y值总还是随x的增加而增加。我们称这类变量之间的关系为相关关系。5.1.2相关关系图5.1相关关系024681012141605101520xy虽然各组数据不是准确地服从f(x)关系,但y值总还是随x的增加而变化。5.1概述回归分析的主要内容:应用数学的方法,对大量的测量数据进行处理,从而得出比较符合事物内部规律的数学表达式(数学模型)。),,,,(21Ncccxfy(5-1)待定常数5.2最小二乘法原理假设x和y是具有某种相关关系的物理量,它们之间的关系可用下式给出:5.2最小二乘法原理同时测量x,y的数值,设有m对观测结果:),(,),,(),,(2211mmyxyxyx利用观测值,确定。设x,y关系的最佳形式为:Nccc,,,21)ˆ,,ˆ,ˆ,(ˆ21Ncccxfy(5-2)(5-3)最佳估计值如不存在测量误差,则:micccxfyNii,2,1),,,,(21(5-4)由于存在测量误差,因而式(5-3)与(5-4)不相重合,即有:miyyeiii,,2,1ˆ(5-5)残差——误差的实测值5.2最小二乘法原理式(5—3)中的x变化时,y也随之变化。如果m对观测值中有比较多的y值落到曲线(5—1)上,则所得曲线就能较为满意地反映被测物理量之间的关系,y值同时出现的概率最大,则曲线(5—3)就是曲线(5—1)的最佳形式。如图5.1a所示。如果误差服从正态分布,则概率P(e1,e2,…,em)为:miimiiieyyS1212)ˆ((5—7)当P最大时,求得的曲线就应当是最佳形式。从图5-1a中可以看出,显然,此时下式应最小:miiimyyeeeP122212)ˆ(exp21),,,((5—6)即残差平方和最小,这就是最小二乘法原理的由来。图5.1aiyˆ38141514108y=0.0108x3-0.4408x2+4.8901x-1.976402468101214161805101520xyx136810131638141514108yi2.489.0213.8314.4613.6410.837.66ei0.52-1.020.170.540.36-0.830.34iyˆ5.2最小二乘法原理这里假定xi无误差。式(5—7)可以写成:miNiicccxfyS1221)ˆ,,ˆ,ˆ,((5—8)S最小,就应有:0,,0,021NcScScS(5—9)即要求求解如下联立方程组:0)ˆ,,ˆ,ˆ,(0)ˆ,,ˆ,ˆ,(0)ˆ,,ˆ,ˆ,(12121211121NmiNiimiNiimiNiicfcccxfycfcccxfycfcccxfy(5—10)正规方正规方程,最程,最小二乘小二乘解。解。5.3直线的回归5.3.1一元直线回归分析对一元线性回归而言,就是配直线的问题,下面通过例题加以分析说明。例5.1研究腐蚀时间与腐蚀深度两个变量之间的关系,可把腐蚀时间作为自变量x,把腐蚀深度作为因变量y,将试验数据记录在表5-1中。求出x,y之间的线性关系。解:将表5-1中的(x,y)数据,在直角坐标系中对应地做出一系列的点,可得图5.2,这种图称之为散点图。与x的关系大致呈直线关系,但并不是确定性的关系,而是一种相关关系:yˆbxayˆ回归系数(5—11)最佳估计值应使其残差平方和最小,残差为:)(iiibxaye(5—12)图5—2、表5—1时间x,min351020304050606590120腐蚀深度y,u406080130160170190250250290460表5-1试验数据图5—2散点图y=3.2149x+45.007R2=0.97110100200300400500020406080100120140时间x腐蚀深度ybxayˆ.5.3.1一元直线回归分析其平方和为:2112)(miiimiibxayeS(5—13)平方和最小,即:...