第九章含虚拟变量的回归模型目前为止,在已学习的线性回归模型中,解释变量X都是定量变量
但有时候,解释变量是定性变量
1虚拟变量的性质通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、宗教、民族、罢工、政团关系、婚姻状况)
如:美国黑人的收入比相应的白人的收入低
的数学平均分数比相应的男生低
定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民
把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量(dummyvariable),用符号D表示
虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型(ANOVA)
Yi=B1+B2Di+ui(9-1)其中Y=初职年薪Di=1,大学毕业=0,非大学毕业假定随机扰动项满足古典线性回归模型的基本假定,根据模型(9-1)得到:非大学毕业生的初职年薪的期望为:E(Yi|Di=0)=B1+B2(0)=B1(9-2)大学毕业生的初职年薪的期望为:E(Yi|Di=1)=B1+B2(1)=B1+B2(9-3)可以看出:截距B1表示非大学毕业生的平均初职年薪,“斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少;(B1+B2)表示大学毕业生的平均初职年薪
零假设:大学教育没有任何益处(即B2=0),可根据t检验值判定b2是否是统计显著的
1大学毕业生和非大学毕业生的初职年薪1模型(9-1)OLS回归结果如下:Yi=18
28Di(9-4)se=(0
44)t=(57
444)p值=(0
000)(0
000)r2=0
8737估计的非大学毕业生的平均初职年薪为18000美