IBM-SPSS第28章多重线性回归研究中的反应变量只有一个,而自变量却有多个时,常用多重回归分析来筛选危险因素、分析交互效应、控制混杂因素、预测等
多重线性回归即是简单线性回归的扩展,其应用前提和简单线性回归完全相同:线性、独立、正态和方差齐,即LINE,实际应用中,残差分析常常用来考察资料是否满足这四个前提条件
多重回归模型1.多重线性回归的数学模型公式中因变量是随机观察值,为常数项,称为偏回归系数(PartialRegressionCoefficient)
表示在其他自变量固定不变的情况下,自变量每改变一个单位时,其单独引起因变量y的平均改变量
ppoxxy11衡量多重回归模型优劣的标准当供建立回归模型的自变量有个时,仅考虑各因素的主效应,可以建立个模型(包括仅含常数项的模型)
自变量增加虽然能减少残差,提高模型的拟合精度,但也使模型复杂化
为保证模型自变量“少而精”,常需要一些量化指标来衡量模型的好坏,常用的指标有决定系数、复相关系数和调整决定系数
1.复相关系数(MultipleCorrelationCoefficient)复相关系数表示模型中所有因变量与自变量()之间线性回归关系的密切程度大小
当时,,为简单相关系数
当有多个自变量时,的值比任何一个自变量与因变量的简单相关系数之绝对值大,所以与简单相关系数不同的是,复相关系数总是大于或等于的(),值越大,说明线性回归关系越密切
pxxx,,,2110R2.决定系数(DeterminateCoefficient)决定系数是复相关系数的平方,即回归平方和占总离均差平方和的比例:总回SSSSR/23.调整的决定系数(AdjustedR-square)调整的增加了对方程中引入自变量的“监督”,当有统计学意义的变量进入方程时,可使调整的增大,而当无统计学意义的变量进入方程