回归直线方程的推导设x与y是具有线性相关关系的两个变量,且相应于样本的一组观测值的n个点的坐标分别是:112233(,),(,),(,),,(,)nnxyxyxyxy,下面给出回归方程的推导
设所求的回归方程为ˆybxa,其中,ab是待确定的参数,那么:ˆiiybxa,(1,2,3,,in),样本中各个点的偏差是ˆ()iiiiyyybxa,(1,2,3,,in)显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,,因此他们的和不能代表n个点与回归直线在整体上的接近程度,而是采用n个偏差的平方和Q来表示n个点与相应直线(回归直线)在整体上的接近程度
即2211ˆ()()nniiiiiiQyyybxa=2222112233()()()()nnybxaybxaybxaybxa求出当Q取最小值时的,ab的值,就求出了回归方程
(一)先证明两个在变形中用到的公式:公式(1)22211()nniiiixxxnx其中12nxxxxn因为2222121()()()()ninixxxxxxxx=22221212()2nnxxxxxxnxnxn=222212()2nxxxnxnx=22212()nxxxnx=221niixnx所以22211()nniiiixxxnx公式(2)11()()nniiiiiixxyyxynxy因为11221()()()()()()()()niinnixxyyxxyyxxyyxxyy=11221122()()nnnnxyxyxyxyyxxyyxxyyxnxy=12121[()()]niinnixyxxxy