多元线性回归模型 一、多元线性回归模型的一般形式 设随机变量 y与一般变量pxxx,,,21的线性回归模型为: pp xxxy22110 写成矩阵形式为: Xy 其中: nyyyy21 npnnppxxxxxxxxxX212222111211111 p10 n21 二、多元线性回归模型的基本假定 1、 解 释 变 量pxxx,,,21是 确 定 性 变 量 , 不 是 随 机 变 量 , 且 要 求npXr a n k1)(。这里的npXrank1)(表明设计矩阵 X中自变量列之间不相关,样本容量的个数应大于解释变量的个数,X是一满秩矩阵。 2、随机误差项具有 0均值和等方差,即:),,2,1,(,,0,),cov(,,2,1,0)(2njijijiniEjii 0)(iE ,即假设观测值没有系统误差,随机误差i 的平均值为 0,随机误差i的协方差为 0 表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立),不存在序列相关,并且具有相同的精度。 3 、正态分布的假定条件为:相互独立niniN,,,,2,1),,0(~212,矩阵表示:),0(~2nIN,由该假定和多元正态分布的性质可知,随机变量 y 服从 n 维正态分布,回归模型的期望向量为:XyE)(;nIy2)var( 因此有),(~2nIXNy 三、多元线性回归方程的解释 对于一般情况含有 p 个自变量的回归方程pp xxxyE22110)(的解释,每个回归系数i 表示在回归方程中其他自变量保持不变的情况下,自变量ix 每增加一个单位时因变量 y的平均增加程度。因此通常把多元线性回归的回归系数称为偏回归系数。下面看个例子,考虑国内生产总值 GDP和三次产业增加值的关系,这个问题中 GDP=321xxx是确定性的函数关系,可以看作误差项为0的特殊回归关系。3个回归系数都是1,对2 解释为第二产业增加值2x 每增加1亿元GDP也增加1亿元。假设做GDP对2x 的一元线性回归,得到回归方程为28 5 5 4.19.5 2 8 9ˆxy,对这个方程回归系数的解释是第二产业增加值每增加1亿元GDP增加1.8554亿元。两个回归方程对同样的经济现象给出了不同的解释,问题出在什么地方呢?多元回归系数表示在回归方程中其他自变量保持不变的情况下,相应自变量每增加一个单位时因变...