6月19日回归分析高考频度:★★★☆☆难易程度:★★☆☆☆1.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是ABCD2.已知下表所示数据的回归直线方程为ˆ44yx,则实数m的值为x23456y3711m21A.16B.18C.20D.223.近期记者调查了热播的电视剧《三生三世十里桃花》,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在10,14,15,19,20,24,25,29,30,34的爱看比例分别为10%,18%,20%,30%,%t,现用这5个年龄段的中间值x代表年龄段,如12代表10,14,17代表15,19,根据前四个数据求得x关于爱看比例y的线性回归方程为ˆ4.68%ykx,由此可推测t的值为A.33B.35C.37D.3914.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如下表:x1234y12284256(1)在图中画出表中数据的散点图;(2)建立y关于x的回归方程,预测第5年的销售量约为多少?附:回归方程ˆˆˆyabx中斜率和截距的最小二乘估计公式分别为1221112ˆnniniiiiiiniiixxyyxynxybxxxnx,ˆˆaybx.5.某汽车公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年利润y(单位:万元)的影响,对近5年的宣传费ix和年利润iy(1,2,3,4,5i)进行了统计,列出了下表:x(单位:千元)2471730y(单位:万元)12345员工小王和小李分别提供了不同的方案.(1)小王准备用线性回归模型拟合y与x的关系,请你帮助建立y关于x的线性回归方程;(系数精确到0.01)(2)小李决定选择对数回归模型拟合y与x的关系,得到了回归方程:1.45ln02ˆ.04yx,并提供了相2关指数20.995R.请用相关指数说明哪个模型更合适,并用此模型预测年宣传费为4万元的年利润.(精确到0.01)(小王也提供了他的分析数据5211.15iiiyy)参考公式:相关指数122211niniiiiyyRyy,回归方程ˆˆˆybxa中斜率和截距的最小二乘估计公式分别为:121ˆniiiniixxyybxx,ˆˆaybx.参考数据:ln403.689,521()538iixx.1.C【解析】只有C中的点在一条直线附近.故选C.2.B【解析】易得4x,代入回归直线方程得12y,所以1123711215m,则18m,故选B.3.B【解析】由题可知前四组的平均数111217222719.5,1018203019.544xy,样本中心点19.5,19.5在回归直线上,代入线性回归方程可得1.24k,则1.24.6%ˆ48yx,当32x时,ˆ35%y.故本题选B.4.【解析】(1)作出散点图如图:3(2)计算可得52x,692y,41418iiixy,42130iix,421()5iixx,11225ˆ73niiiniixynxybxnx,69735225ˆ2ˆaybx,故y关于x的回归直线方程为7325ˆyx,当5x时,7352715ˆy,所以第5年的销售量约为71万件.5.【解析】(1)经计算得12,3xy,5169iiixxyy,又521()538iixx,所以0.13,1.ˆˆ44ba,所以小王建立的y关于x的线性回归方程为0.1314ˆ.4yx.(2)因为52110iiyy,所以小王模型的相关指数20.89R,这个值比小李模型的相关指数小,则小李模型的拟合度更好,所以选择小李提供的模型更合适.当40x时,由小李模型得ˆ5.37y,故预测年宣传费为4万元的年利润为5.37万元.6月20日独立性检验高考频度:★★☆☆☆难易程度:★★☆☆☆41.下列说法错误的是A.在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法B.在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好C.线性回归方程对应的直线ˆˆˆybxa至少经过其样本数据点中的一个点D.在回归分析中,相关指数2R越大,模拟的效果越好2.在下列关于吸烟与患肺癌的22列联表中,d的值为不患肺癌患肺癌总计不吸烟7775427817吸烟d总计98749965A.48B.49C.50D.513....