第五章虚拟与离散变量回归模型前面所研究的回归模型,其变量都是在取一些实际的数值,一般是连续的
实际工作中经常遇到变量取离散数值情形,它的回归模型需要给予特殊的考虑
在经济分析中还经常遇到因变量不是数值,比如买与不买,升与降,有与无等
这些选择可以给予一个虚拟变量并赋以数值代表
这样的回归当然就更有特色了
本章就研究这一类回归模型
第一节虚拟变量作自变量的模型在回归模型中,因变量往往不仅受到那些取实际数值的自变量(如价格、工资收入、产量、温度、距离、重量等等)的影响,而且受到一些不取实际数值的自变量(如性别、国籍、种族、颜色、学位、地震、罢工、政治动乱、政府更叠等等)的影响
要在模型中反映这种影响,可以引进虚拟变量,人为给予这些因素赋以一定数值
如果某因素只有二种选择(如性别),可以引进虚拟变量Di=¿{1i第个样本来自男性¿¿¿¿当然也可以给Di赋值(1,-1)或(1,2),怎样赋值要看实际问题表示与计算方便
如果某因素有多项选择,如学位,你可以引进虚拟变量Di=¿{1学士¿{2硕士¿¿¿¿等等
我们先考虑虚拟变量在模型中作加项,再考虑作乘项
一、虚拟变量作加项,工资性别差异设对某种职业者的工资采集了10个样本,列于下表,工资单位略去,性别栏中1表示男性,0表示女性
1序号12345678910工资22
2性别1001011001我们以性别为自变量建立回归模型Yi=β0+β1Di+εi(5
1)对于表中资料回归得Yi=18
28Di它表示,女性的平均工资为18,男性的平均工资为18+3
由于回归系数β1的t统计1量为7
44,远大于临界值0
44,非常显著,故认为该项工作男女工资存在差别
一般地,对模型(5
1)E(Yi|Di=0)=β0(5