回归分析的基本思想及其初步应用知识梳理一.线性回归方程的确定如果一组具有相关关系的数据1122( ,),(,),,(,),nnx yxyxy 作出散点图大致分布在一条直线附近,那么我们称这样的变量之间的关系为线性相关关系(也称一元线性相关),这条直线就是回归直线,记为 ˆybxa.那么如何求得参数 ab和使得各点与此直线的距离的平方和为最小,即如何求得线性回归方程呢
在所求回归直线方程 ˆybxa中,当 x 取ix 时, iiybxa与实际收集到的数据iy 之间的偏差为()iiiiyyybxa,偏差的平方为22()[()]iiiiyyybxa(如图 1)
即21()niiiQybxa 来刻画出 n 个点与回归直线在整体上的偏差的平方和,显然 Q 取最小值时的 ,a b 的值就是我们所求的: 121()()()niiiniixxyybxx1221niiiniix ynxyxnx aybx 其中( ,)iix y为样本数据,11,nniiiixx yynn为样本平均数, ( , )x y 称为样本点中心,且所求线性回归直线经过样本点中心(如图 2 所示). 当回归直线斜率0b 时,为线性正相关, 0b 时为线性负相关
应注意,这个最小距离不是通常所指的各数据的点( ,)iix y到直线的距离,而是各数据点( ,)iix y沿平行 y 轴方向到直线的距离(如图 1 所示).对 于 上 面 参 数 ab和的 求 法 原 理 及 方 法 是 简 单 的 , 但 是 运 算 量 较 大 , 需 要 将用心 爱心 专心1 oybxayxyx图 2ybxaiyyixx iy 2()iiyyo图 121()niiiQybxa展开,