第五章线性回归的定式偏差•§5.1变量关系非线性•§5.2异常值、规律性扰动、参数变化和虚拟变量回归•§5.3解释变量遗漏和包含无关解释变量第一页,共八十八页。§5.1变量关系非线性一、问题线性回归模型都假设变量关系是线性随机函数关系,或者经过特定数学变换以后是线性随机函数关系。但实际变量关系可能会存在偏差,存在用线性模型分析非线性关系的可能性。把非线性变量关系当作线性关系处理,违反误差项均值为0的假设,对线性回归分析的有效性有根本性的破坏作用。第二页,共八十八页。201X假设两个变量之间的为Y=其中,满足和线性回归模真实关系型的其他假设。Eε=0012001120011XXXXX但如果我们直接用Y=进行回归分析,=-+-+E-+-E显然不可能始终为0。把非线性关系作为线性关系进行分析是变量关系的误识别。不仅会使得回归分析的拟合程度降低,还会对经济规律做出错误判断,以及导致较大的预测偏差,属于计量经济分析比较严重的问题。第三页,共八十八页。二、发现与判断首先是用数理经济分析的方法,对模型的函数关系进行更深入的分析。其次是根据数据及其分布图形、散点图进行直接判断。更重要的方法是根据回归残差序列,从技术角度发现和判断异常值问题。(1)回归残差序列根据被解释变量的实际值和回归理论值之差计算。(2)在EVIEWS软件进行回归分析时,可以在得到回归结果后在回归结果窗口点击View/Actual,Fitted,Residual/View/Actual,Fitted,Residualtable,直接得到回归残差序列和残差序列图。(3)如果模型存在变量关系非线性问题,回归残差序列会变现出有规律的变化。第四页,共八十八页。ei当发现模型的回归残差序列有下图所示的规律性变化,就应该考虑存在把非线性关系(二次函数等)当作线性关系进行回归的问题。非线性变量关系的残差序列第五页,共八十八页。三、问题的处理和非线性回归•第一步是恢复变量之间的真实函数关系;•第二步是设法通过幂函数、对数化等数学变换等,把非线性关系转化为正确的线性回归模型。•当函数无法通过初等数学变换转化为线性模型时,需要直接处理非线性回归模型。Xe:Y=+,其中、、是未如知参数。第六页,共八十八页。假设不能通过初等数学变换转化为线性关系的非线性函数关系为:1212,,,;,,KPYfXXX其中,X1,X2,…XK是K个解释变量,β1,β2…,βP是P个参数,f为多元非线性函数,且对β1,β2…,βP是连续可微的。对于这种非线性回归模型,解决的方法之一是利用级数展开方法做非线性函数的近似线性函数,把模型强制性转化为线性模型。第七页,共八十八页。泰勒级数展开NoImage10200,,,Pbbb泰勒级数展开先要取一组参数的初始值:将上述非线性函数在10200,,,Pbbb处对12P,,,做泰勒级数展开,并只取其中的线性项而忽略所有的高次项,得到102001020012102001101,,,0,,,,,,;,,,PPKPbbbPPPbbbfYfXXXbbbbfb第八页,共八十八页。1020010200121020001,,,1,,,,,,;,,,PPPKPiiibbbPiiibbbfYfXXXbbbbf整理上述展开式,移项合并可化为:其中,为原变量关系中误差项与泰勒级数展开的高阶项之和。第九页,共八十八页。1020010200121020001,,,1,,,,,,;,,,PPPKPiiibbbPiiibbbfMYfXXXbbbbfZ1122PPMZZZ若令:我们得到:1212,11211PPP是一,,,的性回模型,可以用最小二乘法估其中,,的估值,我,b,,b。这个M对ZZZ线归计参数计们记为b第十页,共八十八页。经过泰勒级数展开得到的线性模型只是原变量关系的近似,虽然可以把11211,,Pbbb作为原模型参数的估计,但效果可能没有保证。由于10200,,Pbbb和参数真实值的近似程度越高,级数展开忽略的高阶项越不重要,因此提高级数展开初始值与参数真实值的近似程度有利于提高上述间接估计的精度。提高近似...