第一章统计案例1.对变量x,y进行回归分析时,依据得到的4个不同的回归模型作出残差图,则模型拟合精度最高的是()解析:选A.用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,由此可知A选项对应的模型拟合精度最高.故选A.2.若一函数模型为y=ax2+bx+c(a≠0),为将y转化为t的线性回归方程,需要进行变换,即令t=()A.x2B.(x+a)2C.D.ax+b解析:选C.由题意,知y=a+.令t=,则y=at+,满足题意,故选C.3.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.R2变大D.解释变量x与预报变量y的相关性变强解析:选B.由散点图,知去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.4.某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y的统计数据如下表:广告费用x(万元)2356销售利润y(万元)57911由表中数据,得线性回归方程l:y=bx+a(b=,a=y-bx),则下列结论正确的是()A.b<0B.a<0C.直线l过点(4,8)1D.直线l过点(2,5)解析:选C.因为b=1.4>0,a=y-bx=8-1.4×4=2.4>0,所以排除A、B;因为y=1.4x+2.4,所以1.4×2+2.4=5.2≠5,所以点(2,5)不在直线l上,所以排除D;因为x=4,y=8,所以回归直线l过样本点的中心(4,8),故选C.5.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知x1+x2+x3+x4+x5=150,由最小二乘法求得回归直线方程为y=0.67x+54.9,则y1+y2+y3+y4+y5的值为_________________________________.解析:由题意,得x=(x1+x2+x3+x4+x5)=30,且回归直线y=0.67x+54.9恒过点(x,y),则y=0.67×30+54.9=75,所以y1+y2+y3+y4+y5=5y=375.答案:3756.为了研究司机血液中含有酒精与对事故负有责任是否有关系,从遭遇汽车碰撞事故的司机中随机调查了2000名司机,得到如下列联表:有责任无责任总计血液中含有酒精650150800血液中无酒精7005001200总计13506502000画出列联表对应的等高条形图,并通过图形分析司机血液中含有酒精与对事故负有责任是否有关系.能否在犯错误的概率不超过0.001的前提下认为二者有关系?解:相应的等高条形图如图所示:图中两个深色条的高分别表示司机血液中含有酒精和无酒精的两个样本中对事故负有责任的频率.从图中可以看出,司机血液中含有酒精的样本中对事故负有责任的频率明显高于司机血液中无酒精的样本中对事故负有责任的频率.由此可以认为司机血液中含有酒精与对事故负有责任有关系.由列联表中的数据,得K2的观测值k=≈114.910>10.828.因此,在犯错误的概率不超过0.001的前提下,认为司机血液中含有酒精与对事故负有责任有关系.23