第八章虚拟变量模型1
回归模型中引入虚拟变量的作用是什么
答: 在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况
除此外, 还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况
虚拟变量有哪几种基本的引入方式
它们各适用于什么情况
答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况
3.什么是虚拟变量陷阱
答: 根据虚拟变量的设置原则,一般情况下,如果定性变量有m 个类别,则需在模型中引入 m-1 个变量
如果引入了m 个变量, 就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外, 还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区, 以及性别等因素的影响
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金
解答 : 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Yi=β0+β1Xi+μi其他定性因素可用如下虚拟变量表示:1 有奖学金