多元回归分析的步骤(5 页)Good is good, but better carries it.精益求精,善益求善。三、讨论方法本文实行多元线性回归的方法来设定并建立模型,再利用逐步回归来对变量予以确认和剔除。逐步回归是通过筛选,选择偏回归平方和贡献最大的因子建立回归方程,在决定是否引入一个新的因素时,回归方程要用方差比进行显著性检验。假如判别该影响因子通过显著性检验,那么可选入方程中,否则就不应该进入到回归方程,回归方程中剔除一个变量的标准也是用方差比进行显著性检验 剔除偏回归平方和贡献最小的变量,无论是入选回归方程还是从回归方程中剔除 符合条件的选入项和剔除项为止,逐步回归的方法剔除了对因变量影响小的因素 减小了分析问题的难度,提高了计算效率和回归方程的稳定性有较好的预测精度。运用多元线性回归预测的基本思路是在确定因变量和多个自变量以及它们之间的关系后,通过设定自变量参数的回归方程对因变量进行预测。具体如下:式中: Y 表示为粮食总产量,C 和 a 为回归系数,C、a 是待定参数,X 为所选取的影响因素.多元线性回归方法可分为强行进入法、消去法、向前选择法、向后剔除法和逐步进入法等,本文运用 SPSS22.0 软件,对选择的自变量全部进入回归模型,即强行进入法进行预测。该模型的优点是方法简单、预测速度快、外推性好等。四、分析与结果本文选取 6 个解释变量,讨论河南省粮食产量 y,解释变量为:X1 粮食播种面积,X2 农业从业人,X3 农用机械总动力,X4 农田有效灌溉面积,X5 化肥施用折纯量,X6 农村用电量。以河南省粮食产量为因变量,以如上 6 个解释变量为自变量做多元线性回归(数据选取 2025 年《河南统计年鉴》,见附录一)。用 SPSS 做变量的相关分析,从相关矩阵(表 4-1)中可以看出 y 与自变量的相关系数大多都在 0.9 以上,说明所选择变量与 y 高度线性相关,用 y 与自变量做多元线性回归是合适的。用 SPSS 做变量系数分析(表 4-2)表 4-2 系数B标准错误BetaT显著性(常数)-6733.268 3146.969-2.140.041X18.3152.765.2623.007.006X2.155.296.121.524.604X3-.199.105-.607-1.901.068X42.6192.687.169.974.338X55.7702.4921.0472.315.028X61.0865.174.089.210.835表 4-1 相关X1X2X3X4X5X6yX11.687 .965 .918 .927 .970 .978 X2.687 1.686 .456 .448 .731 .616 X3.965 .686 1.946 .930 .990 .985 X4.918 .456 .946 1.961 .9...