第十章 Logistic 回归分析 第一节 Logistic 回归基本概念 线性回归模型的一个局限性是要求因变量是定量变量(定距变量、定比变量)而不能是定性变量(定序变量、定类变量)
但是在许多实际问题中,经常出现因变量是定性变量(分类变量)的情况
可用于处理分类因变量的统计分析方法有:判别分别(Discriminant analysis)、Probit 分析、Logistic 回归分析和对数线性模型等
在社会科学中,应用最多的是 Logistic回归分析
Logistic 回归分析根据因变量取值类别不同,又可以分为 Binary Logistic 回归分析和 Multinomial Logistic 回归分析,Binary Logistic 回归模型中因变量只能取两个值 1 和 0(虚拟因变量),而 Multinomial Logistic 回归模型中因变量可以取多个值
本章将只讨论Binary Logistic 回归,并简称 Logistic 回归
因变量只取两个值,表示一种决策、一种结果的两种可能性
从模型角度出发,不妨把事件发生的情况定义为Y=1,事件未发生的情况定义为Y=0,这样取值为0、1 的因变量可以写为下式: 10y 事件发生 事件未发生 我们可以采用多种方法对取值为0、1 的因变量进行分析
通常以p表示事件发生的概率(事件未发生的概率为1-p),并把p看作自变量Xi的线性函数,即 p P( y 1) F(iiX) i 1,2,… , k 不同形式的F(·),就有不同形式的模型,最简单的莫过于使F(·)为一线性函数,即 01122kk=+++++pXXX (10-113) 我们可能会认为可用普通最小二乘法对上式进行估计,但因p的值一定在区间[0,1]内,而且当p接近于0或1时,自变量即使有很大变化p的值也不可能变化