第11章一元线性回归分析欧阳光明(2021.03.07)11.1(1)散点图(略),产量与生产费用之间正的线性相关关系。(2)920232.0r(3)检验统计量2281.24222.142tt,拒绝原假设,相关系数显著。11.2(1)散点图(略)。11.3(1)0ˆ表示当0x时y的期望值。(2)1ˆ表示x每变动一个单位y平均下降0.5个单位。11.4(1)%902R(2)1es11.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下:运送距离x825215107055048092013503256701215运送时间y3.51.04.02.01.03.04.51.53.05.0要求:(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态:(2)计算线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。解:(1)可能存在线性关系。(2)相关性x运送距离(km)y运送时间(天)x运送距离(km)Pearson相关性1.949(**)显著性(双侧)0.000N1010y运送时间(天)Pearson相关性.949(**)1显著性(双侧)0.000N1010**.在.01水平(双侧)上显著相关。有很强的线性关系。(3)系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)0.1180.3550.3330.748x运送距离(km)0.0040.0000.9498.5090.000a.因变量:y运送时间(天)回归系数的含义:每公里增加0.004天。11.6下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区人均GDP(元)人均消费水平(元)北京辽宁上海江西河南贵州陕西224601122634547485154442662454973264490115462396220816082035要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。(4)计算判定系数,并解释其意义。(5)检验回归方程线性关系的显著性(a=0.05)。(6)如果某地区的人均GDP为5000元,预测其人均消费水平。(7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。解:(1)人均GDP(元)400003000020000100000人均消费水平(元)120001000080006000400020000__可能存在线性关系。(2)相关系数:相关性人均GDP(元)人均消费水平(元)人均GDP(元)Pearson相关性1.998(**)显著性(双侧)0.000N77人均消费水平(元)Pearson相关性.998(**)1显著性(双侧)0.000N77**.在.01水平(双侧)上显著相关。有很强的线性关系。(3)回归方程:系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。(4)模型摘要模型RR方调整的R方估计的标准差1.998(a)0.9960.996247.303a.预测变量:(常量),人均GDP(元)。人均GDP对人均消费的影响达到99.6%。(5)F检验:ANOVA(b)模型平方和df均方F显著性1回归81,444,968.680181,444,968.6801,331.692.00残差305,795.034561,159.007合计81,750,763.7146a.预测变量:(常量),人均GDP(元)。b.因变量:人均消费水平(元)回归系数的检验:t检验系数(a)模型非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a.因变量:人均消费水平(元)(6)某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。11.7(1)散点图(略),二者之间为负的线性相关关系。(2)估计的回归方程为:xy7.41892.430ˆ。回归系数7.4ˆ1表示航班正点率每增加1%,顾客投诉次数平均下降4.7次。(3)检验统计量3060.2959.42tt(P-Value=0.001108<05.0),拒绝原假设,回归系数显著。(4)1892.54807.41892.430ˆ80y(次)。(5)置信区间:(37.660,70.619);...