第八章多重共线性多重共线性多重共线性及其影响多重共线性的发现和检验多重共线性的克服和处理引子:发展农业和建筑业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收入模型:其中:CS财政收入(亿元);NZ农业增加值(亿元);GZ工业增加值(亿元);JZZ建筑业增加值(亿元);TPOP总人口(万人);CUM最终消费(亿元);SZM受灾面积(万公顷)数据样本时期1978年-2003年(资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)iiiiiiiiuSZMCUMTPOPJZZGZNZCS6543210VariableCoefficientStd.Errort-StatisticProb.农业增加值NZ-1.5350900.129778-11.828610.0000工业增加值GZ0.8987880.2454663.6615580.0017建筑业增加值JZZ-1.5270891.206242-1.2659890.2208总人口TPOP0.1511600.0337594.4776460.0003最终消费CUM0.1015140.1053290.9637830.3473受灾面积SZM-0.0368360.018460-1.9953820.0605截距项-11793.343191.096-3.6957040.0015R-squared0.995015Meandependentvar5897.824AdjustedR-squared0.993441S.D.dependentvar5945.854S.E.ofregression481.5380Akaikeinfocriterion15.41665Sumsquaredresid4405699.Schwarzcriterion15.75537Loglikelihood-193.4165F-statistic632.0999Durbin-Watsonstat1.873809Prob(F-statistic)0.000000财政收入模型的EViews估计结果●可决系数为0.995,校正的可决系数为0.993,模型拟合很好。模型对财政收入的解释程度高达99.5%。●F统计量为632.10,说明0.05水平下回归方程整体上显著。●t检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。●农业增加值和建筑业增加值的回归系数是负数。农业和建筑业的发展反而会使财政收入减少吗?!这样的异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?模型估计与检验结果分析一、多重共线性及其分类多重共线性及其分类完全多重共线性近似多重共线性多重共线性的概念对于模型Yi=0+1X1i+2X2i++kXki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。如果存在c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。•如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。但无论是解释变量之间严格的线性关系还是较严重的近似线性关系,都会给多元线性回归分析造成严重的不利影响,甚至导致回归模型完全失效。(一)多重共线性的理论后果OLS估计量仍保持BLUE性质(高斯-马尔科夫定理仍然成立)完全多重共线性导致参数的OLS估计量无法求出(也可以理解为方差无穷大)。近似多重共线性导致参数的OLS估计量的方差大幅提高二、多重共线性的后果1.虽是线性无偏且最小方差,但其方差是一个非常大的数值,故其估计的精度下降;2.回归系数的置信区间加宽,导致接受零假设的可能性增大,从而t检验失效3.R2可能很大,F统计值也很高;4.最小二乘估计量及其标准差都对数据的微小变化非常敏感;5、模型预测置信区间加宽,预测方差加大,以至失去预测的意义(二)多重共线性的实际后果(理论后果的具体表现)二、多重共线性的后果完全多重共线性及其危害严格多重共线性不是由于数据原因引起,通常是由于模型把有严格联系的变量引进同一个模型,或者由于虚拟变量设置不当(如陷入虚拟变量陷阱的情况)而引起的。对模型的最小二乘估计量为如果存在完全共线性,则不存在,无法得到参数的估计量。1)(XXYXXX1)(ˆXY以三变量回归模型为例:回归方程为:22110XXY22110ˆXbXbbY2221102)(miniiiiXbXbbYe则求参数最小二乘估计量的正规方程组为:...