电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

logistic回归与线性回归的比较

logistic回归与线性回归的比较_第1页
1/11
logistic回归与线性回归的比较_第2页
2/11
logistic回归与线性回归的比较_第3页
3/11
1 logistic 回归logistic 回归又称 logistic 回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等.自变量既可以是连续的,也可以是分类的.然后通过 logistic 回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素.同时根据该权值可以根据危险因素预测一个人患癌症的可能性。1.1logistic 回归概述logistic 回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中 w 和 b 是待求参数,其区别在于他们的因变量不同,多重线性回归直接将 w‘x+b 作为因变量,即 y =w‘x+b,而logistic 回归则通过函数 L 将 w‘x+b 对应一个隐状态 p,p =L(w‘x+b),然后根据 p 与 1-p的大小决定因变量的值。假如 L 是 logistic 函数,就是 logistic 回归,假如 L 是多项式函数就是多项式回归.logistic 回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释,多类可以使用 softmax 方法进行处理。实际中最为常用的就是二分类的logistic 回归.Logistic 回归模型的适用条件1 因变量为二分类的分类变量或某事件的发生率,并且是数值型变量。但是需要注意,重复计数现象指标不适用于 Logistic 回归。2 残差和因变量都要服从二项分布。二项分布对应的是分类变量,所以不是正态分布,进而不是用最小二乘法,而是最大似然法来解决方程估量和检验问题。3 自变量和 Logistic 概率是线性关系4 各观测对象间相互独立.原理:假如直接将线性回归的模型扣到 Logistic 回归中,会造成方程二边取值区间不同和普遍的非直线关系。因为 Logistic 中因变量为二分类变量,某个概率作为方程的因变量估量值取值范围为 0-1,但是,方程右边取值范围是无穷大或者无穷小。所以,才引入 Logistic 回归.Logistic 回归实质:发生概率除以没有发生概率再取对数。就是这个不太繁琐的变换改变了取值区间的矛盾和因变量自变量间的曲线关系。究其原因,是发生和...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

logistic回归与线性回归的比较

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部