logistic 回归与多元线性回归区别及若干问题讨论1 多重线性回归(MultipleLinearRegression)Logistic 回归(LogisticRegression)概念多重线性回归模型可视为简单直线模型的直接推广,具有两个及两个以上自变量的线性模型即为多重线性回归模型.属于概率型非线性回归,是讨论二分类(可扩展到多分类)观察结果与一些影响因素之间关系的一种多变量分析方法。变量的特点应变量:1 个;数值变量(正态分布)自变量:2 个及 2 个以上;最好是数值变量,也可以是无序分类变量、有序变量。应变量:1 个;二分类变量(二项分布)、无序/有序多分类变量自变量:2 个及 2 个以上;数值变量、二分类变量、无序/有序多分类变量总体回归模型 LogitP=(样本)偏回归系数含义表示在控制其它因素或说扣除其它因素的作用后(其它所有自变量固定不变的情况下),某一个自变量变化一个单位时引起因变量 Y 变化的平均大小。表示在控制其它因素或说扣除其它因素的作用后(其它所有自变量固定不变的情况下),某一因素改变一个单位时,效应指标发生与不发生事件的概率之比的对数变化值(logitP 的平均变化量),即 lnOR。适用条件 LINE:1、L:线性-—自变量 X 与应变量 Y 之间存在线性关系;2、I:独立性——Y 值相互独立,在模型中则要求残差相互独立,不存在自相关;3、N:正态性—-随机误差(即残差)e 服从均值为零,方差为2的正态分布;4、E:等方差——对于所有的自变量 X,残差 e 的方差齐。观察对象(case)之间相互独立;若有数值变量,应接近正态分布(不能严重偏离正态分布);二分类变量服从二项分布;要有足够的样本量;LogitP 与自变量呈线性关系。