章末归纳总结一、回归分析 1.回归分析 回归分析是对有相关关系的两个变量进行统计分析.相关指数 R2 刻画回归的效果,其计算公式:R2=1-∑n i=1 (yi-y^)2∑n i=1 (yi- y )2,R2 的值越大,模型的拟合效果越好. 2 .建立回归模型的一般步骤(1) 确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2) 画出确定好的解释变量和预报变量的散点图,观察它们之间的关系 ( 如是否存在线性关系 ) .(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系.则选用线性回归方程y^=b^x+a^). (4) 按一定规则估计回归方程中的参数.(5) 得出结果后分析残差图是否有异常 ( 个别数据对应的残差过大,或残差呈现不随机的规律性,等等 ) ,若残差存在异常,则应检查数据是否有误,或模型是否合适等.二、独立性检验1 .判断两个分类变量之间是否有关系的方式有三种:三维柱形图、二维条形图和独立性检验.其中三维柱形图和二维条形图只能粗略地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.2 .独立性检验的一般步骤:(1) 根据样本数据制成 2×2 列联表.(2) 根据公式计算 K2的值.(3) 比较 K2与临界值的大小关系作统计推断. [ 例 1] 已知对两个变量 x 、 y 的观测数据如下表:(1) 画出 x 、 y 的散点图;(2) 求出回归直线方程.x35404239454642505848y5.90 6.20 6.30 6.55 6.53 9.52 6.99 8.72 9.49 7.50[ 解析 ] (1) 散点图如下图所示.(2) x =44.5,∑10 i=1x2i=20183, y =7.37,∑10 i=1xiyi=3346.32, 则b^=3346.32-10×44.5×7.3720183-10×44.52≈0.1752. a^≈7.37-0.1752×44.5=-0.4175. ∴回归直线方程为y^=0.1752x-0.4175. [ 例 2] 想象一下一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录 .年龄 / 周岁3456789身高 /cm90.897.6104.2110.9115.6122.0128.5年龄 / 周岁10111213141516身高 /cm134.2140.8147.6154.2160.9167.5173.0(1) 年龄 ( 解释变量 ) 和身高 ( 预报变量 ) 之间具有怎样的相关关系?(2) 如果年龄相差 5 岁,则身高有多大差异? (3 ~ 16岁之间 )(3) 如果身高相差 20cm ,其年龄相差多少?(4) 计算残差,说明该函数模型能够较...