电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

第五章 虚拟与离散变量回归模型VIP免费

第五章 虚拟与离散变量回归模型_第1页
1/61
第五章 虚拟与离散变量回归模型_第2页
2/61
第五章 虚拟与离散变量回归模型_第3页
3/61
第五章虚拟与离散变量回归模型前面所研究的回归模型,其变量都是在取一些实际的数值,一般是连续的。实际工作中经常遇到变量取离散数值情形,它的回归模型需要给予特殊的考虑。在经济分析中还经常遇到因变量不是数值,比如买与不买,升与降,有与无等。这些选择可以给予一个虚拟变量并赋以数值代表。这样的回归当然就更有特色了。本章就研究这一类回归模型。第一节虚拟变量作自变量的模型在回归模型中,因变量往往不仅受到那些取实际数值的自变量(如价格、工资收入、产量、温度、距离、重量等等)的影响,而且受到一些不取实际数值的自变量(如性别、国籍、种族、颜色、学位、地震、罢工、政治动乱、政府更叠等等)的影响。要在模型中反映这种影响,可以引进虚拟变量,人为给予这些因素赋以一定数值。如果某因素只有二种选择(如性别),可以引进虚拟变量Di=¿{1i第个样本来自男性¿¿¿¿当然也可以给Di赋值(1,-1)或(1,2),怎样赋值要看实际问题表示与计算方便。如果某因素有多项选择,如学位,你可以引进虚拟变量Di=¿{1学士¿{2硕士¿¿¿¿等等。我们先考虑虚拟变量在模型中作加项,再考虑作乘项。一、虚拟变量作加项,工资性别差异设对某种职业者的工资采集了10个样本,列于下表,工资单位略去,性别栏中1表示男性,0表示女性。表5.1.1序号12345678910工资22.019.018.021.718.521.020.517.017.521.2性别1001011001我们以性别为自变量建立回归模型Yi=β0+β1Di+εi(5.1.1)对于表中资料回归得Yi=18.00+3.28Di它表示,女性的平均工资为18,男性的平均工资为18+3.28=21.28。由于回归系数β1的t统计1量为7.44,远大于临界值0.44,非常显著,故认为该项工作男女工资存在差别。一般地,对模型(5.1.1)E(Yi|Di=0)=β0(5.1.2)E(Yi|Di=1)=β0+β1(5.1.3)若β1显著性检验通过,应认为Di的属性集合存在显著差别。上面的模型除了考虑性别外,没有考虑任何其它因素。如果考虑其它因素对工资的影响,比如工龄,可以取实际数值,以X表示,则有模型Yi=β0+β1Di+β2Xi+εi(5.1.4)此时E(Yi|Xi,Di=0)=β0+β2Xi(5.1.5)E(Yi|Xi,Di=1)=(β0+β1)+β2Xi(5.1.6)如果系数β1是统计显著的,表示工资还是存在性别差异。如果某个因素有3个属性,能不能用这种两项选择的开关变量表示呢?可以使用两个开关变量。比如学位分3个等级:学士,硕士,博士,就引进D1i=¿{0学士¿¿¿¿D2i=¿{0硕士¿¿¿¿建立如下模型Yi=β0+β1D1i+β2D2i+β3X+εi(5.1.7)则E(Yi|D1=0,D2=0)=β0+β3X(5.1.8)E(Yi|D1=1,D2=0)=β0+β1+β3X(5.1.9)E(Yi|D1=1,D2=1)=β0+β1+β2+β3X3(5.1.10)不过更多的情况是将两个虚拟变量用来区分两个因素,如用D1区分性别,用D2区分肤色,等等。可以使用更多的虚拟变量,如有人研究业余兼职者的工资状况,建立过如下的回归方程2Y=37.07+0.403X1−90.06D2+75.51D3+47.33D4+113.64D5+2.26X6+ε(5.1.11)式中X1是第一职业工资,D2~D5都是开关变量,用来区分肤色(白人,非白人),居住地(城区,非城区),地域(西部,非西部),学历(高等教育,非高等教育)。X6是年龄。这一段谈到的都是虚拟变量作加项,它影响回归方程的均值。二、虚拟变量作乘项,储蓄与收入分段拟合比较这一段考虑虚拟变量作乘项,它影响回归方程的斜率。开始我们也看一个具体的数值例子。表5.1.2是英国1946~1963年居民储蓄与收入资料,单位是百万英镑。表5.1.2年份储蓄收入年份储蓄收入19460.368.819550.5915.519470.219.419560.9016.719480.0810.019570.9517.719490.2010.619580.8218.619500.1011.019591.0419.719510.1211.919601.5321.119520.4112.719611.9422.819530.5013.519621.7523.919540.4314.319631.9925.2表上粗略显示,资料可以分为两个时期:1946~1954年为战后恢复时期,1955~1963年为振兴时期。我们可以分别建立两个回归方程Y1i=β10+β11X+ε1i,i=1,⋯,n1(5.1.12)Y2i=β20+β21X+ε2i,i=1,⋯,n2(5.1.13)对于本例具体资料,可以回归得Y1i=−0.2663+0.0470X1i(5.1.14)Y2i=−1.7501+0.1504X2i(5.1.15)两个方程的斜率不一样,反映储蓄增长速度后来加快了。要检验这组资料是否真的应该划分为两组,建立两个回归模型,或说...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

第五章 虚拟与离散变量回归模型

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部