13.2 两变量间的相关性、回归分析和独立性检验典例精析题型一 求回归直线方程【例 1】下表是关于某设备的使用年限(年)和所需要的维修费用(万元)的几组统计数据:x23456y2.23.85.56.57.0(1)若 y 对 x 呈线性相关关系,求出 y 关于 x 的线性回归方程 y=bˆ x+ aˆ ;(2)估计使用年限为 10 年时,维修费用为多少?【解析】(1)因为51ixiyi=112.3,51ix=4+9+16+25+36=90,且 x =4,y =5,n=5,所以bˆ ===1.23, aˆ =5-1.23×4=0.08,所以回归直线方程为 y=1.23x+0.08.(2)当 x=10 时,y=1.23×10+0.08=12.38,所以估计当使用 10 年时,维修费用约为 12.38 万元.【点拨】当 x 与 y 呈线性相关关系时,可直接求出回归直线方程,再利用回归直线方程进行计算和预测.【变式训练 1】某工厂经过技术改造后,生产某种产品的产量( 吨)与相应的生产能耗(吨标准煤)有如下几组样本数据.x3456y2.5344.5据相关性检验,y 与 x 具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,那么 y 关于 x 的回归直线方程是 .【解析】先求得 x =4.5,y =3.5,由 yˆ =0.7x+a 过点( x ,y ),则 a=0.35,所以回归直线方程是 yˆ =0.7x+0.35.题型二 独立性检验【例 2】研究小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计分析推断.【解析】由列联表得:a=26,b=184,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460.所以 K2==≈4.804,由于 K2≈4.804>3.841,所以有 95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.【变式训练 2】(2013 东北三省三校模拟)某研究小组为了研究中学生的身体发育情况,1在某学校随机抽出 20名 15 至 16 周岁的男生,将他们的身高和体重制成 2×2 的列联表,根据列联表的数据,可以有 %的把握认为该学校 15至 16 周岁的男生的身高和体重之间有关系.超重不超重合计偏高415不偏高31215合计71320附:独立性检验临界值表P(K2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828(独立性检验随机变量 K2值的计算公式:K2=)【解析】由表可得 a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,运用独立性检验随机变量 K2值的计算公式得 K2==≈5.934,由于 K2≈5.934>5.024,所以有 97.5%的把握认为该学校 15 至 16 周岁的男生的身高和体重之间有关系.总结提高1.在研究两个变量之间是否存在某种关系时,必须从散点图入手.2.样本的随机性导致由线性回归方程所作出的预报也具有随机性.2