回归分析的基本思想及其初步应用(25分钟60分)一、选择题(每小题5分,共25分)1.下列三个说法:(1)残差平方和越小的模型,拟合的效果越好;(2)用R2来刻画回归的效果时,R2的值越小,说明模型拟合的效果越好;(3)直线y=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(bxi+a)]2是该坐标平面上所有直线中与这些点的偏差最小的直线.其中正确的个数为()A.1个B.2个C.3个D.4个【解析】选B.由R2的定义可知:R2越接近于1,表明两个随机变量线性相关性越强,所以(2)不正确,其余说法正确.2.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温x(℃)181310-1用电量y(度)24343864由表中数据得回归直线方程y=bx+a中b≈-2,预测当气温为-4℃时,用电量的度数约为()A.68℃B.67℃C.66℃D.65℃【解析】选A.由表格得(,)为(10,40),又(,)在回归方程y=bx+a上且b≈-2,所以40=10×(-2)+a,解得:a=60,所以y=-2x+60.当x=-4时,y=-2×(-4)+60=68.3.(2014·重庆高考)已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据测算的线性回归方程可能是()A.y=0.4x+2.3B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.41【解题指南】根据正相关可知斜率为正,再根据线性回归方程经过点(,)可求出结果.【解析】选A.由正相关可知斜率为正,故可排除C,D两项,又因为y=0.4x+2.3经过点(3,3.5),故A项正确.【补偿训练】(2015·临沂高二检测)某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:度)之间有下列数据关系:x-2-1012y54221甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6;其中正确的是()A.①B.②C.③D.①③【解析】选A.回归方程y=bx+a表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.4.(2015·泰安高二检测)在回归分析中,R2的值越大,说明残差平方和()A.越大B.越小C.可能大也可能小D.以上均错【解析】选B.因为R2=n2iii1n2ii1(yy)1(yy),所以当R2越大时,(yi-iy)2越小,即残差平方和越小.5.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程y=bx+a,其中b=0.76,a=-b.据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元【解题指南】样本中心点(,)一定在回归直线上.2【解析】选B.由题意得==10,==8,所以a=8-0.76×10=0.4,所以y=0.76x+0.4,把x=15代入得到y=11.8.二、填空题(每小题5分,共15分)6.在研究身高和体重的关系时,求得相关指数R2≈,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.【解析】结合R2的计算公式R2=n2iii1n2ii1(yy)1(yy)可知,当R2=0.64时,身高解释了64%的体重变化.答案:0.647.若根据10名儿童的年龄x(岁)和体重y(kg)数据用最小二乘法得到用年龄预报体重的回归方程是y=2x+7,已知这10名儿童的年龄分别是2,3,3,5,2,6,7,3,4,5,则这10名儿童的平均体重是.【解析】由题意可得=2+7,又=4,所以=15.答案:15kg8.(2015·扬州高二检测)某校高二(8)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58),求得的回归直线方程为y=2.5x+a,则某同学每周学习20小时,估计数学成绩约为分.【解析】=×(15+23+16+24+12)=18,=×(79+97+64+92+58)=78,把(,)代入y=2.5x+a,可求得a=33,把x=20代入y=2.5x+33得y=2.5×20+33=83.3答案:83三、解答题(每小题10分,共20分)9.关于x与y有如下数据关系:x24568y3040605070为了对x,y两个变量进行统计分析,现有以下两种线性模型:甲模型y=6.5x+17.5,乙模型y=7x+17,试比较哪一个模型拟合的效果更好.【解析】=52iii152ii1(yy)1(yy)=1-=0.845,=52iii152ii1(yy)1(y...