1第八章多重共线性问题一、问题的种类和原因二、多重共线性的危害三、多重共线性的测定四、多重共线性的克服和处理28.1问题的种类和原因1、完全多重共线性一个自变量刚好是其他自变量的线性组合如果存在c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。矩阵X至少有一列向量可由其他列向量(不包括第一列)线性表出,它是非满秩的。模型设定问题识别问题32、近似多重共线性如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。主要是数据问题,也有模型设定问题8.1问题的种类和原因43、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。8.1问题的种类和原因5(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(3)样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。截面数据样本:问题不那么严重,但多重共线性仍然是存在的。8.1问题的种类和原因68.2(近似)多重共线性的危害1、普通最小二乘法估计量的方差和标准差变大,即精确度下降;2、置信区间变宽;3、t值不显著;4、R平方值较高,但t值并不都显著;5、OLS估计量及其标准差对数据的微小变化非常敏感,即它们趋于不稳定;7以二元线性模型y=1x1+2x2+为例:2221221212221222122211121)(1/)()()ˆvar(iiiiiiiiiixxxxxxxxxxXX221211rxi2221221)(iiiixxxx恰为X1与X2的线性相关系数的平方r2,即X1对X2回归的拟合优度。由于r21,故1/(1-r2)18多重共线性使参数估计值的方差增大,1/(1-r2)为方差扩大因子(VarianceInflationFactor,VIF)当完全不共线时,r2=02121/)ˆvar(ix当近似共线时,0