§4.3多重共线性模型中解释变量违反了基本假设1—解释变量之间相互独立的假设,导致解释变量之间线性相关,称为多重共线性(Multicollinearity)。一、多重共线性的概念二、实际经济问题中的多重共线性三、多重共线性的后果四、多重共线性的检验五、克服多重共线性的办法六、案例—中国粮食生产函数一、多重共线性的概念对于模型Yi=0+1X1i+2X2i++kXki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。如果存在c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全为0,即某一个解释变量可以用其他解释变量的线性组合表示,则称为解释变量间存在完全共线性(PerfectMulticollinearity)。如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为近似共线性(NearMulticollinearity)。完全多重共线性的情况并不多见,一般出现一定程度上的多重共线性,即近似共线性。完全多重共线性Y=XB+N=(X1,……,Xi,……,Xk)B+N完全共线性:∣X'X∣=0,(X'X)-1不存在00200864243211111321332211XXXxxxxcxcxciiiiii这里,近似多重共线性近似多重共线性:∣X‘X∣≈0,(X’X)-1存在,但主对角线上的元素很大000001.499.299.101.143211111321332211XXXxxxxcxcxciiiiii其中02211xcxcxckikii二、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。成比例LKuLKQiiiiiif,,(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,根据相对收入假设,时间序列数据建立消费函数(当期收入与前期消费相关)ucIctttt1210(3)样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。三、多重共线性的后果1、完全共线性下参数估计量不存在如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。的OLS估计量为:YXXXβ1)(ˆY=XB+N例:对二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:y=0+1x1+2x2+y=0+(1+2)x1+2、近似共线性下OLS估计量非有效近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。12)()ˆ(XXβCov3、参数估计量经济含义不合理如果模型中两个解释变量具有线性相关性,例如X2=X1,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。4、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外5、模型的预测功能失效变大的方差容易使区间预测的“区间”变大,使预测失去意义。注意:除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。多重共线性检验的任务是:(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在...