第十三章 多重线性回归与相关 [教学要求] 了解: 多重共线性的概念及其对回归分析结果的影响;通径分析的基本过程及其应用。 熟悉:多重相关与回归分析的基本原理与方法。 掌握:掌握多重相关与回归分析结果的解释;相关、回归、简单相关、偏相关与复相关,简单回归、偏回归与全回归等概念。 [重点难点] 第一节 多重线性回归的概念及其统计描述 一、变量(Y)关于 k 个自变量()的多重线性回归的数学模型为: kXXX,...,,21ikikiiiXXXYεββββ+++++=...22110。实质是将每个 Y 的观测值用该模型在最小残 差平方和的原则下进行分解。 二、标准回归系数为将各个变量按iiiiSXXX−=*变换后,再进行多重回归计算所得的 回归系数。因为通过标准化过程消除了各个变量的计量单位不同对回归系数的影响, 所以各个标准回归系数的大小能直接反映该自变量对Y 变量的回归效应的大小。 三、多重回归分析的前提条件完全与简单线性回归相同:线性、独立、正态和等方差,即 LINE。 第二节 多重线性回归的假设检验 一、 整体回归效应的假设检验(方差分析)的原假设为H0: 0...321=====kββββ;其过程 是通过对Y 的总变异进行分解,用回归均方与残差均方的比值构造F 检验统计量,然后根 据相应的F 分布决定是否拒绝原假设。 二、偏回归系数的t检验的的原假设为H0: βi=0,即第i个总体偏回归系数为零;其过程是 用第i个偏回归系数的估计bi与该偏回归系数的标准误之 比值构造t统计量: 1biibiSbt = 然后根据相应的t分布决定是否拒绝原假设。 第三节 复相关系数与偏相关系数 一、 确定系数、复相关系数与调整确定系数 1、复相关系数的平方称为确定系数(coefficient of determination)或决定系数,记为R 2,用以反映线性回归模型能在多大程度上解释反应变量Y的变异性。其定义为 SSTSSRR =2 其取值范围为。若确定系数R 102 ≤≤ R2的值接近于 1,指示样本数据很好地拟合了所选用的线性回归模型。R 2直接反映回归方程中所有自变量解释反应变量Y总变异的百分比。同时,R 2也可以解释为回归方程使反应变量Y的总变异减少的百分比。 2、复相关系数(multiple correlation coefficient) R, 定义为确定系数的平方根,即 SSTSSRR = 3、调整的R 2(adjusted R-Square):当回归方程中包含有很多自变量,即使其中有一些自变量对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R 2值表现为只增不减。...