第2课时线性回归分析A级基础巩固一、选择题1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表所示:分类甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A、B两变量有更强的线性相关性()A.甲B.乙C.丙D.丁解析:r越接近1,相关性越强,残差平方和m越小,相关性越强,所以选D正确.答案:D2.已知回归方程y=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04解析:因为残差ei=yi-yi,所以残差的平方和为(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:C3.若某地财政收入x与支出y满足线性回归模型y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过()A.10亿元B.9亿元C.10.5亿元D.9.5亿元解析:x=10时,y=0.8×10+2=10.因为|e|<0.5,所以年支出预计不会超过10.5亿元.答案:C4.下列说法中正确的是()①相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;②回归直线y=bx+a一定经过样本点的中心(x,y);③随机误差e满足E(e)=0,其方差D(e)的大小用来衡量预报的精确度;④相关指数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好.A.①②B.③④C.①④D.②③解析:①线性相关关系r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,①错误;②回归直线y=bx+a一定通过样本点的中心(x,y),②正确;③随机误差e是衡量预报精确度的一个量,它满足E(e)=0,③正确;④用相关指数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,④错误.答案:D5.如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()1A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.答案:B二、填空题6.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.解析:由ei恒为0,知yi=yi,即yi-yi=0,答案:17.根据如下样本数据得到的回归方程为y=bx+a,若a=5.4,则x每增加1个单位,估计y________个单位.x34567y42.5-0.50.5-2解析:由题意可得,x=5,y=(4+2.5-0.5+0.5-2)=0.9,因为回归方程为y=bx+a,若a=5.4,且回归直线过点(5,0.9),所以0.9=5b+5.4,解得b=-0.9,所以x每增加一个单位,估计y减少0.9个单位.答案:减少0.98.已知方程y=0.85x-82.71是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,y的单位是kg,那么针对某个体(160,53)的残差是________.解析:将x=160代入y=0.85x-82.71,得y=0.85×160-82.71=53.29,所以残差e=y-y=53-53.29=-0.29.答案:-0.29三、解答题9.(2018·全国卷Ⅱ)下图是某地区2000年到2016年环境基础设施投资额y(单位:亿元)的折线图.2为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:方法一从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境...