回归直线方程的推导 设 x 与 y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的 n 个点的坐标分别是:112233( ,),(,),(,),,(,)nnx yxyxyxy,下面给出回归方程的推导。 设所求的回归方程为 ˆybxa,其中 ,a b 是待确定的参数,那么:ˆiiybxa,(1,2,3,,in),样本中各个点的偏差是 ˆ()iiiiyyybxa,(1,2,3,,in)显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,,因此他们的和不能代表 n 个点与回归直线在整体上的接近程度,而是采用 n 个偏差的平方和Q 来表示 n个点与相应直线(回归直线)在整体上的接近程度。即2211ˆ()()nniiiiiiQyyybxa=2222112233()()()()nnybxaybxaybxaybxa求出当Q 取最小值时的 ,a b 的值,就求出了回归方程。 (一) 先证明两个在变形中用到的公式:公式( 1 ) 22211()nniiiixxxnx 其中12nxxxxn 因为2222121()()()()ninixxxxxxxx=22221212()2nnxxxxxxnxnxn=222212()2nxxxnxnx=22212()nxxxnx=221niixnx 所以22211()nniiiixxxnx公式(2) 11()()nniiiiiixxyyx ynxy 因为11221()()()()()()()()niinnixxyyxxyyxxyyxxyy=11221122()()nnnnx yx yx yx yy xx yy xx yy xnxy用心 爱心 专心=12121[()() ]niinnix yxxxyyyyxnxy=12121()()[]nnniiixxxyyyx ynyxnxynn=12niiix ynxynxy=1niiix ynxy 所以11()()nniiiiiixxyyx ynxy (二)推导:将Q 的表达式的各项先展开,再合并、变形2222112233()()()()nnQybxaybxaybxaybxa 22212112222212()[2()2()2()][()()() ]nnnnyyyy bxay bxay bxabxabxabxa -----展开222211111222nnnnniiiiiiiiiiiybx yaybxabxna -----以 a,b 为同类项,合并2222111112()2nniinnniiiiiiiiiyxnanabbxbx yynn --以 a,b 的次数为标准整理22221112()2nnniiiiiiinana ybxbxbx yy...