12.4 线性回归方程一、知识导学1. 变量之间的常见关系有如下两类:一类是确定性函数关系,变量之间的关系可以用函数表示;一类是相关关系,变量之间有一定的联系,但不能完全用函数来表达2. 能用直线方程abxy^近似表示的相关关系叫做线性相关关系3. 一般地,设有(x,y)的 n 对观察数据如下:x1x2x3x……nxy1y2y3y……ny当 a,b 使2222211)(......)()(abxyabxyabxyQnn取得最小值时,就称abxy为拟合这 n 对数据的线性回归方程,将该方程所表示的直线称为回归直线.4.线性回归方程abxy中的系数ba,满足:niiniiniiiniiniiynabxyxaxbx111112由此二元一次方程组便可依次求出ab,的值:xbyaxxnyxyxnbniiniiniiniiniii2112111 (*)5.一般地,用回归直线进行拟合的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式(*)求出ba,,并写出线性回归方程.二、疑难知识导析1.现实世界中两个变量的关系中更多的是相关关系而不是确定性关系,许多物理学中公式看起来是确定性关系,实际上由于公式的使用范围,测量误差等的影响,试验得到的数据之间是相关关系.2.用最小二乘估计方法计算得到的ba,使函数 baQ,达到最小3.还有其他寻找较好的回归直线的原则(如使 y 方向的偏差和最小,使各点到回归直线的距1离之和最小等)4. 比较相关关系绝对值的大小可以比较一组变量之间哪两个变量有更强的(线性)相关关系.5. “最好的”直线方程中“最好”可以有多种解释,也就有不同的求解方法,现在广泛采用的最小二乘法所用的思想是找到使散点到直线abxy在垂直方向上的距离的平方和最小的直线abxy,用这个方法,ba,的求解最简单三、经典例题导讲[例 1]有如下一组 y 与 x 的数据x-3-2-10123y9410149问 y 与 x 的(样本)相关系数 r 是多少?这是否说明 y 与 x 没有关系?错解:040707))((7171xyyxyyxxiiiiii所以相关系数 r=0,即 y 与 x 没有关系.错因:相关系数 r=0 并不是说明 y 与 x 没有关系,而是说明 y 与 x 没有线性相关关系,但有可能有非线性相关关系.正解:040707))((7171xyy...