第一章 统计案例章末复习学习目标 1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤.1.最小二乘法对于一组数据(xi,yi),i=1,2,…,n,如果它们线性相关,则线性回归方程为y=bx+a,其中b==,a=-b.2.2×2 列联表B总计Aaba + b cdc + d 总计a + c b + d n其中 n=a + b + c + d 为样本容量.3.独立性检验常用随机变量K2=来检验两个变量是否有关系.1.选用的模型不当是产生随机误差的原因之一.( √ )2.相关系数 r=-0.85,说明两个变量相关性较弱.( × )3.在散点图大致呈线性时,求得回归方程才有意义.( √ )4.等高条形图能展示列联表数据的占比.( √ )5.利用随机变量 K2进行独立性检验时,其值越小,犯错误的概率越小.( × )6.独立性检验若得出结论有 99%的可信度,则意味着这个结论一定是正确的.( × )类型一 线性回归分析例 1 为了估计山上积雪融化后对下游灌溉的影响,在山下建立了一个观测站,测量了最大积雪深度 x(尺)与当年灌溉面积 y(千亩),得到连续 10 年的数据如下表:年序最大积雪深度 x/尺灌溉面积 y/千亩115.228.6210.419.3321.240.5418.635.6526.448.9623.445.0713.529.2816.734.1924.046.71019.137.4试求线性回归方程.考点 线性回归方程题点 求线性回归方程解 为了研究这些数据中所蕴含的规律,我们把各年最大积雪深度作为横坐标,相应的灌溉面积作为纵坐标,作散点图如图所示.从图中看到,数据点大致落在一条直线附近,这告诉我们变量 x 与 y 之间的关系大致可看作是线性关系;从图中还看到,这些点又不都在一条直线上,这表明 x 与 y 的关系并没有确切到给定 x 就可以唯一确定 y 的程度.事实上,还有许多其他因素对 y 产生影响,如当年的平均气温、当年的降雨量等,这些都是影响 y 取值的随机因素.如果我们研究 x 与 y 的关系,利用公式,得:=×(15.2+10.4+…+19.1)=18.85,=×(28.6+19.3+…+37.4)=36.53,(xi-)2=227.845,(xi-)(yi-)=413.065,(yi-)2=764.961.于是b=≈1.813,a≈36.53-1.813×18.85≈2.355.从而线性回归方程为y=1.813x+2.355.反思与感悟 解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后...