第9章含定性变量的回归模型思考与练习参考答案9.1一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:其中含有k个定量变量,记为xi。对春夏秋冬四个季节引入4个0-1型自变量,记为Di,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。当某自变量xj对其余p-1个自变量的复判定系数2jR超过一定界限时,SPSS软件将拒绝这个自变量xj进入回归模型。称Tolj=1-2jR为自变量xj的容忍度(Tolerance),SPSS软件的默认容忍度为0.0001。也就是说,当2jR>0.9999时,自变量xj将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?ttttktkttDDDXXY332211110000110010110001010010010100011)(616515414313212111kkkkkkXXXXXXXXXXXXDX,k10β4321α答:原因有两个,以例9.1说明。一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。9.3研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系(参见参考文献【3】)。因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。第一个自变量公司的规模是数量型的,用公司的总资产额(百万美元)来计量;第二个自变量公司是定性变量,由两种类型构成,即股份公司和互助公司。数据资料见表9.8,试建立y对公司规模和公司类型的回归。表9.8iyx1公司类型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份解:对定型变量“公司类型”进行数量化处理:引入虚拟变量x2:公司类型为“互助”时,x2=1,为“股份”时,x2=0。则表9.5中数据转换成以下数据:iyx1公司类型1171511226921321175143031152210416027717122101819120194290110162381112816401215272013112950143868015318501621224017201660181330501930124020142460建立回归方程y=b0+b1x1+b2x2+ε用SPSS软件作线性回归,得到输出结果如下:ModelSummary.946a.895.8833.221Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),公司类型,x1a.R检验:拟合优度R2=0.883,接近1,说明回归拟合的效果较好。ANOVAb1504.4132752.20772.497.000a176.3871710.3761680.80019RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),公司类型,x1a.DependentVariable:yb.F检验:F值=72.497,Sig.值为0,说明回归方程通过F检验。Coefficientsa41.9302.01020.859.000-.102.009-.911-11.443.000-8.0551.459-.439-5.521.000(Constant)x1公司类型Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:ya.T检验:回归系数通过t检验,回归方程为:y=41.930-0.102x1-8.055x2说明:若引入虚拟变量x2,当公司类型为“互助”时,x2=0,为“股份”时,x2=1。则回归方程为:y=33.874-0.102x1+8.055x2结果分析:(1)股份制公司采取保险革新措施的积极性比互助型公司高,原因可能在于股份制公司建立在共同承...