9.5变量间的相关关系、回归分析及独立性检验一、选择题1.线性回归方程表示的直线y=a+bx,必定过()A.(0,0)点B.(x,0)点C.(0,y)点D.(x,y)点解析:回归直线系数a,b有公式a=y-bx,即y=a+bx,∴直线y=a+bx必定过(x,y)点.答案:D2.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r2=1或r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)解析:由定义可知相关系数|r|≤1,故D错误.答案:D3.(·山东威海调研)已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为()A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.23解析:回归直线必过点(4,5),故其方程为y-5=1.23(x-4),即y=1.23x+0.08.答案:C4.(·江苏徐州)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②解析:①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.答案:C二、填空题5.(·江苏徐州)独立性检验中的统计假设就是假设两个研究对象Ⅰ和Ⅱ________.答案:相互独立(没有关系)6.已知回归直线方程y=0.5x-0.801,则当x=25时,y的估计值是________.解析:将x=25代入y=0.5x-0.801可得.答案:11.6997.(·山东潍坊调研)给出下列四个命题:①∀x∈R,cosx=sin+sin一定不成立;②今年初某医疗研究所为了检验“达菲(药物)”对甲型H1N1流感病毒是否有抑制作用,把墨西哥的患者数据库中的500名使用达菲的人与另外500名未用达菲的人一段时间内患甲型H1N1流感的疗效记录作比较,提出假设H0:“达菲不能起到抑制甲型H1N1流感病毒的作用”,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05,说明达菲抑制甲型H1N1流感病毒的有效率为95%;③|a·b|=|a||b|是|λa+μb|=|λ||a|+|μ||b|成立的充要条件;④如右图的茎叶图是某班在一次测验时的成绩:可断定:女生成绩比较集中,整体水平稍高于男生.其中真命题的序号是________.(填上所有真命题的序号)解析:对于①,等式展开后可化简为asinx+bcosx=0的形式,可知一定有解;对于②,正确解释是:有95%的把握认为“达菲对甲型H1N1流感病毒有抑制作用”;对于③,由向量模的性质知不正确.答案:④三、解答题8.(·安徽蚌埠)已知x、y之间的一组数据如下表:x13678y12345对于表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试利用最小二乘法判断哪条直线拟合程度更好?解答:用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为s1=2+(2-2)2+(3-3)2+2+2=;用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为s2=(1-1)2+(2-2)2+2+(4-4)2+2=. s2<s1,故用直线y=x+拟合程度更好.9.(·江苏徐州调研)在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中有6人患色盲.(1)根据以上数据建立一个2×2列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少?附临界值参考表:P(K2≥x0)0.100.050.0250.100.0050.001x02.7063.8415.0246.6357.87910.828解答:(1)患色盲不患色盲总计男38442480女6514520总计449561000(2)假设H0:“性别与患色盲没有关系”,根据(1)中2×2列联表中数据,可求得K2=≈27.14,又P(K2≥10.828)=0.001,即H0成立的概率不超过0.001,故若认为“性别与患色盲有关系”,则出错的概率为0.001.10.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?解答:(1)根...