实用标准文案精彩文档多元线性回归模型一、多元线性回归模型的一般形式设随机变量y与一般变量pxxx,,,21的线性回归模型为:ppxxxy22110写成矩阵形式为:Xy其中:nyyyy21npnnppxxxxxxxxxX212222111211111p10n21二、多元线性回归模型的基本假定1、解释变量pxxx,,,21是确定性变量,不是随机变量,且要求npXrank1)(
这里的npXrank1)(表明设计矩阵X中自变量列之间不相关,样本容量的个数应大于解释变量的个数,X是一满秩矩阵
2、随机误差项具有0均值和等方差,即:),,2,1,(,,0,),cov(,,2,1,0)(2njijijiniEjii0)(iE,即假设观测值没有系统误差,随机误差i的平均值为0,随机误差i的协方差为0表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立),不存在序列相关,并且具有相同的精度
3、正态分布的假定条件为:相互独立niniN,,,,2,1),,0(~212,矩阵表示:),0(~2nIN,由该假定和多元正态分布的性质可知,随机变量y服从n维正态分布,回归模型的期望向量为:XyE)(;nIy2)var(因此有),(~2nIXNy三、多元线性回归方程的解释对于一般情况含有p个自变量的回归方程ppxxxyE22110)(的解释,每个回归系数i表示在回归方程中其他自变量保持不变的情况下,自变量ix每增加一个单位时因变量y的平均增加程度
因此通常把多元线性回归的回归系数称为偏回归系数
下面看个例子,考虑国内生产总值GDP和三次产业增加值的关系,这个问题中GDP=321xxx是确定性的函数关系,可以看作误差项为实用标准文案精彩文档0的特殊回归关系
3个回归系数都是1,对2解释为第二产业增加值2x每增加1亿元GDP也增加1亿元
假设做GDP对2x的一元线性回归,得到回归方程为2855