第十二章多元回归分析在许多实际问题中,影响因变量的因素有一个时,我们用一元回归分析解决问题,但是影响因变量的因素往往有多个,此时问题就上升到了一个因变量同多个自变量的多元回归问题。当因变量与自变量之间为线性关系时,我们称之为多元线性回归。多元性性回归分析的原理同一元线性回归基本相同,但计算上要复杂得多。主要知识点:建立的回归模型中回归系数和误差项分别代表的含义:回归系数表示当其他个自变量不变时,第个自变量一个单位因变量的平均变动量;误差项表示不能由各个自变量与之间的线性关系所解释的变异性。利用软件用最小二乘法对参数进行估计的方法及步骤:在Excel中使用“工具”“数据分析”“回归”输入数据区域“确定”,即可得到各参数的估计值,此时便可以写出回归方程。拟合优度的检验方法:方法一:多重判定系数表示在因变量的总变差中被估计的回归方程所解释的比例;故越大越好。方法二:估计标准误差表示根据所建立的回归方程,用自变量来预测因变量时,平均预测误差的大小;故越小越好,越小说明波动性越小。用软件进行线性关系检验的方法:在Excel中,在“工具”“数据分析”“回归”方差分析一栏中有“SignificanceF”值(即P值),当时,拒绝原假设;当时,接受原假设。回归系数的检验:检验单个自变量对因变量的影响是否显著,检验步骤同线性关系的检验,检验过程中可能会因为“多重共线性”问题导致某些自变量无法通过检验。检验步骤:第1步:提出假设。对于任意参数有第2步:计算检验的统计量t。第3步:做出统计决策。给定显著性水平,根据自由度=n-k-1查t分布表,得的值。若,则拒绝原假设;若,则不拒绝原假设。多重共线性:产生原因:自变量之间的相关性;检验方法:方法一:检验模型中各对自变量之间是否显著相关,若显著相关则暗示存在多重共线性;方法二:当模型的线性关系检验(F检验)显著时,几乎所有回归系数i的t检验却不显著;方法三:当回归系数的正负号与预期的相反时也预示着多重共线性的存在;问题的处理:方法一:将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关;方法二:如果要在模型中保留所有的自变量,那就应该:ⅰ避免根据t统计量对单个参数进行检验。ⅱ对因变量y值得推断(估计或预测)限定在自变量样本值的范围内。利用回归方程进行预测:利用给定的k个自变量,求出因变量y的平均值的预测区间和个别值的预测区间。变量选择:原理:对统计量进行显著性检验,将一个或一个以上的自变量引入模型,如果增加一个自变量会使得残差平方和(SSE)明显减少,则将该自变量留在模型中否则剔除。主要方法:1)向前选择2)向后剔除3)逐步回归本章知识结构如下:1、建立回归模型回归方程2、利用最小二乘法对参数进行估计参数包括3、写出回归方程4、方程拟合优度的检验5、线性关系检验6、回归系数的检验检验单个自变量对因变量的影响是否显著,检验步骤同线性关系的检验,检验过程中可能会因为“多重共线性”问题导致某些自变量无法通过检验。7、利用回归方程进行预测利用给定的k个自变量,求出因变量y的平均值的预测区间和个别值的预测区间。8、变量选择——我称之为“模型的简化”主要方法原理:对统计量进行显著性检验,将一个或一个以上的自变量引入模型,如果增加一个自变量会使得残差平方和(SSE)明显减少,则将该自变量留在模型中,否则剔除。9、多重共线性问题1、产生原因:自变量之间的相关性2、检验方法本章例题对于绝大多数的钢种而言,磷是有害的元素之一,要求含磷越低越好,经过试验技术人员发现,高磷钢的效率与高磷钢的出钢量及高磷钢中的FeO含量有一定关系,所测数据如下表:试验序号出钢量()含量()效率(y)187.913.282.0方法一:多重判定系数方法二:估计标准误差1)提出假设2)计算统计量3)作出决策a)向前选择b)向后剔除c)逐步回归a)计算各对自变量之间的相关系数,并对各相关系数进行显著性检验;b)当模型的线性关系进行F检验显著时,几乎所有回归系数的t检验却不显著;c)回归系数与预期的的相反;多元回归分析2101.413.584.03109.820.080.0493.014.288.6588.016.481.56115.314.283.575...