课时作业1回归分析的基本思想及其初步应用时间:45分钟分值:100分一、选择题(每小题6分,共计36分)1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;③y与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④,故选D.答案:D2.由一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)得到的线性回归方程为y=bx+a,下列说法不正确的是()A.直线y=bx+a必经过点(,)B.直线y=bx+a至少过点(x1,y1),(x2,y2),…,(xn,yn)中的一个C.直线y=bx+a的斜率为D.直线y=bx+a是坐标平面上与各点(x1,y1),(x2,y2),…,(xn,yn)偏差最小的直线解析:由回归直线方程可知,由一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)得到的回归直线方程y=bx+a,不一定要经过这些数据点,可以在回归直线方程的附近,因此,B的说法是不正确的.答案:B3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是()A.模型1的R2为0.98B.模型2的R2为0.80C.模型3的R2为0.50D.模型4的R2为0.25解析:R2的值越大,说明模型拟合效果越好,故选A.答案:A4.下列说法不正确的是()A.回归分析中,R2的值越大,说明残差平方和越小B.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1C.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D.画残差图时,纵坐标为残差,横坐标一定是编号1解析:残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重估计值等,故选D.答案:D5.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析:D选项中,若该大学某女生身高为170cm,则可断定其体重约为:0.85×170-85.71=58.79kg.故D不正确.答案:D6.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r20,U与V是负相关,相关系数r2<0,故选C.答案:C二、填空题(每小题8分,共计24分)7.某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系x24568y3040605070y与x的线性回归方程为y=6.5x+17.5,当广告支出5万元时,随机误差的效应(残差)为________.解析:因为y与x的线性回归方程为y=6.5x+17.5,当x=5时,y=50,当广告支出5万元时,由表格得:y=60,故随机误差的效应(残差)为60-50=10.答案:108.在研究身高和体重的关系时,求得相关指数R2≈________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.解析:R2≈0.64表示“身高解释了64%的体重变化”或者说体重差异有64%是由身高引起的.答案:0.649.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为y=2x+a,若样本点(r,1)与(1,s)的残差相同,则r和s的关系为________.解析:由残差的定义可得,1-(2r+a)=s-(2+a),化简得,s=3-2r.2答案:s=3-2r三、解答题(共计40分)10.(10分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方...