生物统计学教案第十一章 多元回归及复相关分析教学时间:1 学时教学方法:课堂板书讲授教学目的:重点掌握多元回归及复相关分析讲授难点: 多元回归及复相关分析11.1 多元线性回归方程11.1。1 多元线性回归模型一个典型的多元回归数据可列成下表观测次数YX1X2┅Xj┅Xk1y1x11x21xj1xk12y2x12x22xj2xk2┇┇┇┇┇┇pypx1px2pxjjxkj┇┇┇┇┇┇nynx1nx2nxjnxkn第 p 次观测值为yp=α+β1x1p+β2x2p+…+βkxkp+εp, p=1,2,…,n上式称为多元线性回归模型,其中 εp是服从正态分布 N(0,σ2)的随机变量。11.1.2 正规方程可以用最小二乘法求出 α 和 βj的估量值 a 和 bj,从而得出多元回归方程。用最小二乘法求 bj,首先会得到一组联立方程,称为正规方程:解该方程组可以得到 bj,a 由下式得到:回归方程为:式子中的 a 称为常数项,bj称为偏回归系数.11。1.3 多元回归方程的计算 (略)11.1.6 回归方程中各自变量对因变量贡献大小的比较多元回归方程中的偏回归系数的含义是,在其它变量都固定的情况下,某一变量对因变量的贡献。由于各自变量的单位不同,因此通过比较偏回归系数的大小,来决定各自变量对因变量贡献的大小是不行的。为了达到这一目的,就需对回归方程进行标准化,得到标准回归方程。标准回归方程的总平方和 SYY=1,各偏回归系数为无单位的量,通过比较标准偏回归系数,可以确定它们对因变量贡献的大小.剔除贡献小的自变量,从而构建成最优回归方程.所谓最优回归方程是指,回归方程中包括全部对 Y 显著的变量,而不包含对 Y不显著的变量。但是,用这种方法筛选最优回归方程有一定的局限性。假如各自变量之间存在显著相关,某些自变量对因变量的贡献是通过另一自变量体现出,当从方程中剔除该变量后,使得留在方程中的变量变成不显著的变量。而剔除的变量恰恰是一个有重要贡献的变量。这一问题,需要通过其它方法解决。11。2 复相关分析11.2.1 复相关系数复相关系数是因变量与所有自变量之间相关程度的度量.相当于实际观测值与回归估量值之间的简单相关系数。11。2。2 偏相关系数在多个自变量与因变量及自变量之间都存在显著相关时,只用其中一个自变量与因变量计算简单相关系数,不能真正反应两变量之间的真实关系。为了能真正反应某一自变量与因变量之间的真实关系,就要保证在其它自变量都保持不变的情况下,计算它们之间的相关系数,这时的相关系数称为偏相关系数。11.3 逐步回归分析11.3.1 最优回...