第七章回归分析6—罗吉斯蒂克回归回归分析的类型因变量与自变量都是定量变量的回归分析——即我们常做的回归分析因变量是定量变量,自变量中有定性变量的回归分析—即含有哑变量的回归分析因变量是定性变量的回归分析—Logistic回归分析因变量是定性变量的回归分析—Logistic回归分析从多元线性回归到Logistic回归例7.4这是200个不同年龄和性别的人对某项服务产品的认可的数据(logi.sav).其中:年龄是连续变量,性别是有男和女(分别用1和0表示)两个水平的定性变量,而变量“观点”则为包含认可(用1表示)和不认可(用0表示)两个水平的定性变量。ÄêÁäºÍ¹ÛµãµÄÉ¢µãͼÄêÁä8070605040302010¹Ûµã£¨0ΪÈϿɣ¬1Ϊ²»ÈϿɣ©1.21.0.8.6.4.20.0-.2从这张图可以看出什么呢?ÐÔ±ð£¨0:Å®£¬1:ÄУ©1.00.00Count120100806040200OPINION.001.00从这张图又可以看出什么呢?从多元线性回归到Logistic回归这里观点是因变量,只有两个值;所以可以把它看作成功概率为p的Bernoulli试验的结果.但是和单纯的Bernoulli试验不同,这里的概率p为年龄和性别的函数.必须应用Logistic回归。多元线性回归不能应用于定性因变量的原因首先,多元线性回归中使用定性因变量严重违反本身假设条件,即:因变量只能取两个值时,对于任何给定的自变量值,e本身也只能取两个值。这必然会违背线性回归中关于误差项e的假设条件。其次,线性概率概型及其问题:由于因变量只有两个值;所以可以把它看作成功概率p,取值范围必然限制在0—1的区间中,然而线性回归方程不能做到。另外概率发生的情况也不是线性的。Logistic函数Logistic的概率函数定义为:我们将多元线性组合表示为:102030405060700.20.40.60.8agepLogistic函数于是,Logistic概率函数表示为:经过变形,可得到线性函数:这里,事件发生概率=P(y=1)事件不发生概率=1-P(y=0)发生比:对数发生比:这样,就可将logistic曲线线性化为:从P到logitP经历了两个步骤变换过程:第一步:将转换成发生比,其值域为0到无穷第二步:将发生比换成对数发生比,其值域科为经过转换,将PlogitP,在将其作为回归因变量来解释就不再有任何值域方面的限制了,即可线性化!Logistic回归系数的意义以logitP方程的线性表达式来解释回归系数,即:在logistic回归的实际研究中,通常不是报告自变量对P的作用,而是报告自变量对logitP的作用。Logistic回归系数的意义以发生比的指数表达式来解释回归系数与logitP不同,发生比具有一定的实际意义,代表一种相对风险。因此对logistic回归系数的解释通常是从发生比的指数表达式出发的。Logistic回归系数的意义例如:在取得了logistic回归系数的各bi的解以后,将其带入函数,如果分析x变化一个单位对于的影响幅度,可以用(x+1)表示,并将其待入上式,得到新的发生比Logistic回归系数的意义将两个发生比集中在一起有:将此称为发生比率,它可测量自变量一个单位的增加给原来的发生比所带来的变化,一般表达式为:说明在其他情况不变的情况下,x一个单位的变化使原来的发生比扩大倍。Logistic回归系数的意义比如,原来的为6:4(比值为1.5),如果一个自变量变化一个单位导致的发生比率为exp(0.693)=2,即表示这一变化将会导致新发生比值为原来的2倍,即新发生比将是12:4(比值为3)。我们也可用发生比率减1的差来表示发生比的增长率,如发生比率为2.3,就可以说自变量一个单位的变化会使原发生比增加1.3倍(2.3-1=1.3).*Logistic回归系数的意义当logistic回归系数为负数时,发生比率小于1。这时的表达要特别小心。比如发生比率为0.8时,表示新发生比只有原来的80%,那么下降的倍数则是(1-0.8=)0.2.Logistic回归应用以例7.4为例,说明logistic回归分析SPSS选项:Analyze—Regression—BinarylogisticVariablesintheEquation-.072.01329.4841.000.931-1.778.36623.6441.000.1693.500.63930.0241.00033.108agesexConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s)enteredonstep1:age,sex.a.Logistic回归...