第3讲变量间的相关关系、统计案例1.某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=-5x+150,则下列结论正确的是()A.y与x具有正的线性相关关系B.若r表示y与x之间的线性相关系数,则r=-5C.当销售价格为10元时,销售量为100件D.当销售价格为10元时,销售量为100件左右解析:选D.由回归直线方程知,y与x具有负的线性相关关系,A错,若r表示y与x之间的线性相关系数,则|r|≤1,B错.当销售价格为10元时,y=-5×10+150=100,即销售量为100件左右,C错,故选D.2.(2019·湖南湘中名校联考)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果k>3.841,那么有把握认为“X和Y有关系”的百分比为()P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A.5%B.75%C.99.5%D.95%解析:选D.由图表中数据可得,当k>3.841时,有95%的把握认为“X和Y有关系”,故选D.3.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是()A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%解析:选B.因为散点图呈现上升趋势,故人体脂肪含量与年龄正相关;因为中间两个数据大约介于15%到20%之间,故脂肪含量的中位数小于20%.4.(2019·湖北七市(州)联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):广告费x23456销售额y2941505971由上表可得回归方程为y=10.2x+a,据此模型,预测广告费为10万元时销售额约为()A.101.2万元B.108.8万元C.111.2万元D.118.2万元解析:选C.根据统计数据表,可得x=×(2+3+4+5+6)=4,y=×(29+41+50+59+71)=50,而回归直线y=10.2x+a经过样本点的中心(4,50),所以50=10.2×4+a,解得a=9.2,所以回归方程为y=10.2x+9.2,所以当x=10时,y=10.2×10+9.2=111.2,故选C.5.下列说法错误的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好解析:选B.根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好.二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.6.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:y=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:x变为x+1,y=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.答案:0.2457.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.5m10.511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是y=-3.2x+40,且m+n=20,则n=________.解析:x==8+,==6+,回归直线一定经过样本中心(x,),即6+=-3.2+40,即3.2m+n=42.又因为m+n=20,即解得故n=10.答案:108.已知x,y之间的一组数据如下表:x23456y34689对于表中数据,现给出如下拟合直线:①y=x+1;②y=2x-1;③y=x-;④y=...