第一章统计案例复习一、本章知识脉络:二、本章要点追踪:1.样本点的中心(x,y)其中x=xi,y= yi .2.线性回归模型的完美表达式 3.类比样本方差估计总体方差的思想,可以用σ2=e2i=Q(a,b)(n>2)作为 σ2的估计量 其中a=y-bxb=4.我们可以用相关指数 R2来刻画回归的效果,其计算公式是:R2=1- R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.5.建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);统计案例回归分析样本点的中心随机误差残差分析建立回归模型的基本步骤回归分析列联表K2=判断结论成立可能性的步骤(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程 y=bx+x);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。6.作 K2来确定结论“X 与 Y 有关系”的可信程度.三、几个典型例题:例 1 某地区 10 名健康儿童头发和全血中的硒含量(1000ppm)如下,血硒74668869917366965873发硒13101311169714510(1)画出散点图;(2)求回归方程;(3)如果某名健康儿童的血硒含量为 94(1000ppm)预测他的发硒含量.解(1)散点图如下图所示:(2)利用计算器或计算机,求得回归方程:y=0.2358x-6.9803(3)当 x=94 时,y≈15.2因 此 , 当 儿 童 的 血 硒 含 量 为 94 ( 1000ppm ) 时 , 该 儿 童 的 发 硒 含 量 约 为15.2(1000ppm).例2某地大气中氰化物测定结果如下:污染源距离50100150200250300400500氰化物浓度0.6870.3980.2000.1210.090.050.020.01(1)试建立氰化物浓度与距离之间的回归方程.(2)求相关指数.(3)作出残差图,并求残差平方和解析(1)选取污染源距离为变量 x,氰化物浓度为自因变量 y 作散点图.从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立 y 关于 x 的指数回归方程.y=0.9293e-0.0094x(2)相关指数 K2=1-=0.9915(3)编 号12345678污染源距离50100150200250300400500氰化物浓度0.6870.3980.20.1210.090.050.020.01残 差0.10618570.035-0.027...