logistic 回归分析影响公共交通工具的因素 一.绪论鉴于交通工具是我们出行中必不可少的一部分,而随着科技的进展与进步,交通方式愈加趋向于多元化,人们可以选择的交通工具也多种多样,新的交通工具带来便利的同时,也不可避开的给我们带来了一些问题。不同社会地位的人所选择的交通工具的原因与其本身的在因素以及外部条件相关。不同的年龄,性别,收入都是影响人们交通方式的重要因素。应用 Logistic 回归的原理和计算方法,并利用在公共交通调查数据在一次关于公共交通的社会调查中,年龄,月收入,性别与是乘公共汽车上下班还是骑自行车上下班的资料,采纳 Logistic 回归方法,进行假设检验,对影响的因素进行分析。建立 Logistic 回归模型,更加明确因变量与自变量之间的关系。二.Logistic 回归理论 logistic 回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的 logistic 回归。由于 Y 取值非 0 即 1,如设 Y 取 1 的概率为 P,则它取 0 的概率为 Q=1-P。第 i 个观察对象的发生概率比数(odds)为称为发生比,是发生概率与不发生概率的比。发生概率取对数称为 LOGIT 变换。回归系数的解释,β,i 表示 xi 改变一个单位时,logitP 的平均变化量。 相对危险度:RR=P1/P2 比数 :Odds=P/(1-P) 比数比 :OR= 对比数比取自然对数得到关系式: β 的意义是在其他自变量固定不变的情况下,自变量 X 的水平没改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量 X 的水平每增加一个测量单位时所引起的比数比为增加前的倍。Logit 回归模型实质是求一种概率的估量,将某种概率与一个线性模型联系起来。三.实例3.1 原始数据 因变量 y=1 表示乘坐公共汽车,y=0 表示骑自行车。自变量 x1 是年龄,作为连续变量;x2 是月收入,x3 是性别,x3=1 表示男性,x3=0 表示女性,调查对象为工薪族群体。表 1 公共交通社会调查序号 年龄 x1月收入x2性别 x3交通 y1188500022112000032385001423950015281200016318500073615000184210000194695001104812000011551800011256210001135818000114188501015201000101625120010172713001018281500101930950112032100010213318001022331000102338120010344115001025451800112648100010275215001128561800113.2 程序与分析3.2.1 程...