第一章统计案例1.1回归分析的基本思想及其初步应用1.下列命题中正确的是().①任何两个变量都具有相关关系②圆的周长与圆的半径具有相关关系③某商品的需求量与该商品的价格是一种非确定性关系④根据散点图求得的线性回归方程可能是没有意义的⑤两个变量的线性相关关系可以通过线性回归方程,把非确定性问题转化为确定性问题进行研究A.①③④B.②④⑤C.③④⑤D.②③⑤解析显然①是错误的,而②中圆的周长与圆的半径的关系为:C=2πR,是一种确定性的函数关系,故应选C.答案C2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有().A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析因为b>0时,两变量正相关,此时r>0;b<0时,两变量负相关,此时r<0.答案A3.在判断两个变量y与x是否相关时,选择了4个不同的模型,它们的相关指数R2分别为:模型1的相关指数R2为0.98,模型2的相关指数R2为0.80,模型3的相关指数R2为0.50,模型4的相关指数R2为0.25.其中拟合效果最好的模型是().A.模型1B.模型2C.模型3D.模型4解析相关指数R2能够刻画用回归模型拟合数据的效果,相关指数R2的值越接近于1,说明回归模型拟合数据的效果越好.答案A4.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),且ei恒为0,则R2为________.解析由ei恒为0,知yi=yi,即yi-yi=0,故R2=1-=1-0=1.答案15.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程是________.解析由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),可得y-5=1.23(x-4),1即y=1.23x+0.08.答案y=1.23x+0.086.某个服装店经营某种服装,在某周内纯获利y(元)与该周每天销售这种服装件数x之间的一组数据如下表:x3456789y66697381899091(1)求样本中心点.(2)画出散点图.(3)求纯获利y与每天销售件数x之间的回归方程.解(1)=6,≈79.86,中心点(6,79.86).(2)散点图如下:(3)因为b=≈4.75,a=-b≈51.36,所以y=4.75x+51.36.7.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是().A.l1和l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合解析都过样本中心点(s,t),但斜率不确定.答案A8.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得y=0.577x-0.448(x为人的年龄,y为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是().A.年龄为37岁的人体内脂肪含量都为20.90%B.年龄为37岁的人体内脂肪含量为21.01%C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D.年龄为37岁的大部分的人体内脂肪含量为31.5%解析当x=37时,y=0.577×37-0.448=20.901≈20.90,由此估计:年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.答案C9.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:2月平均气温x(℃)171382月销售量y(件)24334055由表中数据算出线性回归方程y=bx+a中的b≈-2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.解析由表格得(,)为(10,38),又(,)在回归直线y=bx+a上,且b≈-2,∴38=-2×10+a,a=58,所以y=-2x+58,当x=6时,y=-2×6+58=46.答案4610.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:=,=71,=79,iyi=1481,b=≈-1.8182,a=71-(-1.8182)×≈77.36,则销量每增加1千箱,...