1/14第48讲数据分析——一元线性回归模型及其应用激活思维1.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的线性回归方程为y=60+90x,下列判断正确的是()A.劳动生产率为1千元时,工资为50元B.劳动生产率提高1千元时,工资提高150元C.劳动生产率提高1千元时,工资约提高为90元D.劳动生产率为1千元时,工资为90元2.给出两组数据x,y的对应值如下表,若已知x,y线性相关,且线性回归方程为y=a+bx,经计算知b=-1.4,则a的值为()x45678y1210986A.17.4B.-1.74C.0.6D.-0.63.对变量x,y有观测数据(xi,yi)(i=1,2,⋯,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,⋯,10),得散点图如图②.由这两个散点图可以判断()2/14①②(第3题)A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关4.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系5.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y∧=0.67x+54.9.零件数x/个10203040503/14加工时间y/min62758189现发现表中有一个数据看不清,请你推断出该数据的值为________.知识聚焦1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点散布在左上角到右下角的区域内,两个变量的这种相关关系称为________.2.线性回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的________的方法叫做最小二乘法.(2)回归方程方程y∧=b∧x+a∧是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),⋯,(xn,yn)的回归方程,其中a∧,b∧是待定参数.b∧=i=1nxi-x-yi-y-i=1nxi-x-2=i=1nxiyi-nx-y-i=1nx2i-nx-2,a∧=y--b∧x-.4/14注:回归直线y∧=b∧x+a∧必过样本点的中心(x-,y-),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.根据回归方程计算的y∧值,仅是一个预报值,不是真实发生的值.3.回归分析(1)定义:对具有________的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),⋯,(xn,yn),其中(x-,y-)称为样本点的中心.(3)相关系数:r=i=1nxi-x-yi-y-i=1nxi-x-2i=1nyi-y-2=i=1nxiyi-nx-y-i=1nx2i-nx-2i=1ny2i-ny-2.当r>0时,表明两个变量________;当r<0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性相关性________.r的绝对值越接近于0,表明两个变量之间________.分类解析目标1两个变量间的相关关系(1)(2020·郴州期末)在各散点图中,两个变量具有正相关关系的是()5/14ABCD(2)(2020·吉安期末)(多选)在下列各图中,两个变量具有相关关系的图是()ABCD(2020·福田期中)如图所示,图中有5组数据,去掉________组数据后(填字母代号),剩下的4组数据的线性相关性最大.6/14(变式)目标2线性回归方程及其应用(2020·烟台期中)某水果经销商为了对一批刚上市水果进行合理定价,将该水果按事先拟定的价格进行试销,得到一组销售数据,如下表所示:试销单价x(元/公斤)1617181920日销售量y(公斤)1681461209056(1)已知变量x,y具有线性相关关系,求该水果日销售量y(单位:公斤)关于试销单价x(单位:元/公斤)的线性回归方程,并据此分析销售单价x∈[16,20]时,日销售量的变化情况;(2)若该水果进价为每公斤15元,预计在今后的销售中,日销售量和售价仍然服从(1)中的线性相关关系,该水果经销商如果想获得最大的日销售利润,此水果的售价x(x∈N*)应定为多少...