1/24第二节一元线性回归方程的建立一元线性回归分析是处理两个变量之间关系的最简单模型,它所研究的对象是两个变量之间的线性相关关系
通过对这个模型的讨论,我们不仅可以掌握有关一元线性回归的知识,而且可以从中了解回归分析方法的基本思想、方法和应用
一、问题的提出例2-1-1为了研究氮含量对铁合金溶液初生奥氏体析出温度的影响,测定了不同氮含量时铁合金溶液初生奥氏体析出温度,得到表2-1-1给出的5组数据
表2-1-1氮含量与灰铸铁初生奥氏体析出温度测试数据如果把氮含量作为横坐标,把初生奥氏体析出温度作为纵坐标,将这些数据标在平面直角坐标上,则得图2-1-1,这个图称为散点图
从图2-1-1可以看出,数据点基本落在一条直线附近
这告诉我们,变量X与Y的关系大致可看作是线性关系,即它们之间的相互关系可以用线性关系来描述
但是由于并非所有的数据点完全落在一条直线上,因此X与Y的关系并没有确切到可以唯一地由一个X值确定一个Y值的程2/24度
其它因素,诸如其它微量元素的含量以及测试误差等都会影响Y的测试结果
如果我们要研究X与Y的关系,可以作线性拟合(2-1-1)我们称(2-1-1)式为回归方程,a与b是待定常数,称为回归系数
从理论上讲,(2-1-1)式有无穷多组解,回归分析的任务是求出其最佳的线性拟合
二、最小二乘法原理如果把用回归方程计算得到的i值(i=1,2,⋯n)称为回归值,那么实际测量值yi与回归值i之间存在着偏差,我们把这种偏差称为残差,记为ei(i=1,2,3,⋯,n)
这样,我们就可以用残差平方和来度量测量值与回归直线的接近或偏差程度
残差平方和定义为:(2-1-2)所谓最小二乘法,就是选择a和b使Q(a,b)最小,即用最小二乘法得到的回归直线是在所有直线中与测量值残差平方和Q最小的一条
由(2-1-2)式可知Q是关于a,b的二次函数,所以它的最小值总是存在的