1 第五章 虚拟与离散变量回归模型 前面所研究的回归模型,其变量都是在取一些实际的数值,一般是连续的
实际工作中经常遇到变量取离散数值情形,它的回归模型需要给予特殊的考虑
在经济分析中还经常遇到因变量不是数值,比如买与不买,升与降,有与无等
这些选择可以给予一个虚拟变量并赋以数值代表
这样的回归当然就更有特色了
本章就研究这一类回归模型
第一节 虚拟变量作自变量的模型 在回归模型中,因变量往往不仅受到那些取实际数值的自变量(如价格、工资收入、产量、温度、距离、重量等等)的影响,而且受到一些不取实际数值的自变量(如性别、国籍、种族、颜色、学位、地震、罢工、政治动乱、政府更叠等等)的影响
要在模型中反映这种影响,可以引进虚拟变量,人为给予这些因素赋以一定数值
如果某因素只有二种选择(如性别),可以引进虚拟变量 个样本来自女性第个样本来自男性第iiDi 0 1 当然也可以给Di赋值(1 ,-1 )或(1 ,2 ),怎样赋值要看实际问题表示与计算方便
如果某因素有多项选择,如学位,你可以引进虚拟变量 博士硕士学士 3 2 1iD 等等
我们先考虑虚拟变量在模型中作加项,再考虑作乘项
一、虚拟变量作加项,工资性别差异 设对某种职业者的工资采集了1 0 个样本,列于下表,工资单位略去,性别栏中1 表示男性,0 表示女性
1 序号 1 2 3 4 5 6 7 8 9 1 0 工资 2 2
2 性别 1 0 0 1 0 1 1 0 0 1 2 我们以性别为自变量建立回归模型 iiiDY10 (5
1) 对于表中资料回归得 iiDY28
18 它表示,女性的平均工资为18,男性的平均工资为18+3