1 logistic 回归logistic 回归又称 logistic 回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域
例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等
以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等
因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等
自变量既可以是连续的,也可以是分类的
然后通过 logistic 回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素
同时根据该权值可以根据危险因素预测一个人患癌症的可能性
1logistic 回归概述logistic 回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处
它们的模型形式基本上相同,都具有 w‘x+b,其中 w 和 b 是待求参数,其区别在于他们的因变量不同,多重线性回归直接将 w‘x+b 作为因变量,即 y =w‘x+b,而logistic 回归则通过函数 L 将 w‘x+b 对应一个隐状态 p,p =L(w‘x+b),然后根据 p 与 1-p的大小决定因变量的值
假如 L 是 logistic 函数,就是 logistic 回归,假如 L 是多项式函数就是多项式回归
logistic 回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释,多类可以使用 softmax 方法进行处理
实际中最为常用的就是二分类的logistic 回归
Logistic 回归模型的适用条件1 因变量为二分类的分类变量或某事件的发生率,并且是数值型变量
但是需要注意,重复计数现象指标不适用于 Logistic 回归
2 残差和因变