回归分析1Logic回归分析1以某项社会调查为例1以本论文的研究方法为例1回归分析回归分析:因变量与一个或多个自变量的函数关系回归分析的分类一元线性回归多元线性回归非线性回归线性回归回归分析回归分析Logistic回归分析•Logistic回归模型:概率非线性模型,因变量y与一些影响因素x的关系的模型•资料:应变量为事件发生或不发生二值变量,也可以是多值变量•自变量为分类变量或连续型变量。•目的:作出以多个自变量估计应因变量的logistic回归方程。•用途:预测事件(现象)发生的概率医学上分析疾病与危险因素的联系多分类(y为多分类变量)二分类(y为二项分类)条件logic回归(配对设计)非条件logic回归(非配对设计)Logic回归无序多分类logistic回归有序多分类logistic回归12,,,mXXX自变量),,,|1(21mXXXYPP因变量y=1发生0不发生在m个自变量的作用下Y=1(发生)的概率记作:1P0一.基本概念Logic回归(非条件logic回归)•事件发生的概率•事件不发生的概率•经数学变换得到•事件发生的概率与未发生的概率之比的自然对数,称为p的Logit变换,记做Logit(p)011011exp()1exp()ppppXXpXX011111exp()pppXXlln=og1itPPPLogic回归(非条件logic回归)二.回归模型Logic回归(非条件logic回归)•三.模型参数的意义0(常数项):所有影响因素均为0时(记作X=0),个体发生事件概率与不发生事件的概率之比的自然对数值。•(回归系数)的含义:某自变量改变一个单位时,个体发生事件概率与不发生事件的概率之比的自然对数变化值。01122ln=logit1mmPXXXPPm:,0,:0,0.5,1PZ01122log()mmitpXXX四.logistic函数的图形Logic回归(非条件logic回归)Logic回归(非条件logic回归)•五.优势比(oddsratio,OR)•Odds(优势,比数,比值)是指某影响因素控制在某种水平时,事件发生率与事件不发生率的比值,即P/(1-P)•OR(oddsratio,优势比、比值比)某影响因素的两个不同水平的优势的比值。1ppodds1100/(1)/(1)PPORPP1111111ppoddsppp1110010010001/(1)()/(1)log()log()()()ppLnORLnppitpitpxxLogic回归(非条件logic回归)•OR与的关系=0,OR=1,影响因素与事件的发生无关。>0,OR>1,影响因素的取值越大,事件的发生的概率越大<0,OR<1,影响因素的取值越大,事件的发生的概率越小1expORP1(y=1/x=1)的概率P0(y=1/x=0)的概率lln=og1itPPPPage11Logic回归(非条件logic回归)六.logistic回归模型的参数估计1.最大似然法估计,最大似然法的基本思想是先建立似然函数或对数似然函数,似然函数或对数似然函数达到极大时参数的取值,即为参数的最大似然估计值。表示第个对象处于事件发生时的概率。概率为1时,,概率为0时,2.优势比估计,可反映某一因素两个不同水平(,)的优势比。11(1)iinYYiiiLPP1,2,,in1ln[ln(1)ln(1)]niiiiiLYPYPiP1iY0iY10ˆexp[()]jjORbcc1c0cLogic回归(非条件logic回归)七.logistic回归模型的假设检验•1.似然比检验•比较两个模型的拟合效果,评估哪个更适合当前研究•假设模型1包含L个自变量。•模型2包含P个自变量,模型2的自变量比模型1多。•似然比统计量G的公式为•为模型1的值,为模型2的值。•G反映模型2较模型1拟合优度提高的程度。lnlL2(lnln)plGLLlnpL模型系数的综合检验卡方dfSig.步骤12.7033.005块12.7033.005步骤1模型12.7033.005Logic回归(非条件logic回归)七.logistic回归模型的假设检验•2.wald检验•将各参数的估计值与0比较,用它的标准误差作为参照,•检验统计量为••u为统计量为各参数的估计值为回归系数的标准差ibbiS/ibiubS方程中的变量BS.E,WalddfSig.Exp(B)x32.5021.1584.6691.03112.205x2.002.002.6611.4161.002x1.082.0522.4861.1151.086步骤1a常量-6.1572.6875.2511.022.002Logic回归(非条件logic...