第一章统计案例复习教案一、本章知识脉络:二、本章要点追踪:1
样本点的中心(x,y)其中x=xi,y=yi
线性回归模型的完美表达式3
类比样本方差估计总体方差的思想,可以用σ2=e2i=Q(a,b)(n>2)作为σ2的估计量其中a=y-bxb=4
我们可以用相关指数R2来刻画回归的效果,其计算公式是:R2=1-R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好
建立回归模型的基本步骤:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+x);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),统计案例回归分析样本点的中心随机误差残差分析建立回归模型的基本步骤回归分析列联表K2=判断结论成立可能性的步骤若存在异常,则检查数据是否有误,或模型是否合适等
作K2来确定结论“X与Y有关系”的可信程度
三、几个典型例题:例1某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,血硒74668869917366965873发硒13101311169714510(1)画出散点图;(2)求回归方程;(3)如果某名健康儿童的血硒含量为94(1000ppm)预测他的发硒含量
解(1)散点图如下图所示:(2)利用计算器或计算机,求得回归方程:y=0
2358x-6
9803(3)当x=94时,y≈15
2因此,当儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15
2(1000ppm)
例2某地大气中氰化物测定结果如下:污染源距离5010015020025030040