最小二乘估计最小二乘估计问题导入: 上一节课我们学习了人的身高与右手一拃长之间近似存在着线性关系,这种线性关系可以有多种方法来进行刻画,那么用什么样的线性关系刻画会更好?这就是本节课我们要讨论的问题。最小二乘估计最小二乘估计 用什么样的线性关系刻画会更好一些?问题 1 :想法:保证这条直线与所有点都近(也就是距离最小)。最小二乘法就是基于这种想法。 问题 2 :用什么样的方法刻画点与直线的距离会方便有效?设直线方程为 y=a+bx ,样本点 A ( xi , yi )方法一、点到直线的距离公式 12 baybxdii方法二、2iibxay y0ii yx ,iibxax,bxay 显然方法二能有效地表示点 A 与直线 y=a+bx 的距离,而且比方法一更方便计算,所以我们用它来表示二者之间的接近程度 问题 3 :怎样刻画多个点与直线的接近程度? 例如有 5 个样本点,其坐标分别为( x1 , y1 ),( x2 , y2 ),( x3 , y3 ),( x4 , y4 ),( x5 ,y5 )与直线 y=a+bx 的接近程度:255244233222211bxaybxaybxaybxaybxay 若有 n 个样本点:( x1 , y1 ) ,… , ( xn , yn ),可以用下面的表达式来刻画这些点与直线 y =a+bx 的接近程度 :2211)]([)]([nnbxaybxay 使上式达到最小值的直线 y=a+bx 就是所求的直线,这种方法称为最小二乘法。xbyaxnxxyxnyxyxbnnn,......2221111212......x,ynnnxxxyyyn如果用 表示用 表示则可得到抽象概括:这样得到的直线方程称为线性回归方程, a,b 为其系数。 1 、在回归直线方程中, b 是回归直线方程的斜率, a 是截距; b 的含义容易理解成增加的单位数,而实际上,它代表 x 每增加一个单位, y 的平均增加单位数。一般的说,当回归系数 b > 0 时,说明两个变量呈正相关关系,它的意义是:当 x 每增加一个单位时, y 就增加 b 个单位;当 b < 0 时,说明两个变量呈负相关关系,它的意义是:当 x 每增加一个单位时, y 就减少 b个单位。2 、回归直线必经过点 ),(yx注:求线性回归方程的系数 :xbyaxnxyxnyxxnxxyxnyxyxbniiniiinnn1221222111)(线性回归方程 :abxyxx1x2x3x4….xnyy1y2y3y4….yn3.例题 1 从...