第二节 一元线性回归方程的建立 一元线性回归分析是处理两个变量之间关系的最简单模型,它所研究的对象是两个变量之间的线性相关关系。通过对这个模型的讨论,我们不仅可以掌握有关一元线性回归的知识,而且可以从中了解回归分析方法的基本思想、方法和应用。 一、问题的提出 例 2-1-1 为了研究氮含量对铁合金溶液初生奥氏体析出温度的影响,测定了不同氮含量时铁合金溶液初生奥氏体析出温度,得到表2-1-1 给出的5 组数据。 表 2-1-1 氮含量与灰铸铁初生奥氏体析出温度测试数据 如果把氮含量作为横坐标,把初生奥氏体析出温度作为纵坐标,将这些数据标在平面直角坐标上,则得图2-1-1,这个图称为散点图。 从图2-1-1 可以看出,数据点基本落在一条直线附近。这告诉我们,变量X 与 Y 的关系大致可看作是线性关系,即它们之间的相互关系可以用线性关系来描述。但是由于并非所有的数据点完全落在一条直线上,因此X 与 Y 的关系并没有确切到可以唯一地由一个X 值确定一个Y 值的程度。其它因素,诸如其它微量元素的含量以及测试误差等都会影响Y的测试结果。如果我们要研究X 与 Y 的关系,可以作线性拟合 ( 2-1-1) 我们称(2 -1 -1 )式为回归方程, a 与 b 是待定常数,称为回归系数。从理论上讲,(2-1-1)式有无穷多组解,回归分析的任务是求出其最佳的线性拟合。 二、最小二乘法原理 如果把用回归方程 计算得到的 i值(i=1,2,…n)称为回归值,那么实际测量值yi与回归值 i之间存在着偏差,我们把这种偏差称为残差,记为ei(i=1,2,3,…,n)。这样,我们就可以用残差平方和来度量测量值与回归直线的接近或偏差程度。残差平方和定义为: (2-1-2) 所谓最小二乘法,就是选择a 和 b 使 Q(a,b)最小,即用最小二乘法得到的回归直线 是在所有直线中与测量值残差平方和Q 最小的一条。由(2-1-2)式可知Q 是关于a,b 的二次函数,所以它的最小值总是存在的。下面讨论的a 和 b 的求法。 三、正规方程组 根据微分中求极值的方法可知,Q(a,b)取得最小值应满足 (2-1-3) 由 (2-1-2)式,并考虑上述条件,则 (2-1-4) (2-1-4)式称为正规方程组。解这一方程组可得 (2-1-5) 其中 (2-1-6) (2-1-7) 式中,Lxy称为xy 的协方差之和,Lxx称为x 的平方差之和。 如果改写(2-1-1)式,可得 (2-1-8) 或 (2-1-9) 由此可见,回归直线是通过点 的,即通过由所有实验测量值的平均值组成的点。从力学观点看, 即是N ...