回归分析方法总结全面1、稳健回归其主要思路是将对异常值十分敏感的经典最小二乘回归中的目标函数进行修改
经典最小二乘回归以使误差平方和达到最小为其目标函数
因为方差为一不稳健统计量,故最小二乘回归是一种不稳健的方法
为减少异常点的作用,对不同的点施加不同的权重,残差小的点权重大,残差大的店权重小
2、变系数回归地理位置加权3、偏最小二乘回归长期以来,模型式的方法和认识性的方法之间的界限分得十分清楚
而偏最小二乘法则把它们有机的结合起来了,在一个算法下,可以同时实现回归建模(多元线性回归)、数据结构简化(主成分分析)以及两组变量之间的相关性分析(典型相关分析)
偏最小二乘法在统计应用中的重要性体现在以下几个方面:偏最小二乘法是一种多因变量对多自变量的回归建模方法
偏最小二乘法可以较好的解决许多以往用普通多元回归无法解决的问题
偏最小二乘法之所以被称为第二代回归方法,还由于它可以实现多种数据分析方法的综合应用
能够消除自变量选取时可能存在的多重共线性问题
普通最小二乘回归方法在自变量间存在严重的多重共线性时会失效
自变量的样本数与自变量个数相比过少时仍可进行预测
4、支持向量回归能较好地解决小样本、非线性、高维数和局部极小点等实际问题
传统的化学计量学算法处理回归建模问题在拟合训练样本时,要求“残差平方和”最小,这样将有限样本数据中的误差也拟合进了数学模型,易产生“过拟合”问题,针对传统方法这一不足之处,svr采用“ε不敏感函数”来解决“过拟合”问题,即f(x)用拟合目标值yk时,取:f(x)=∑svs(αi-α*i)k(xi,x)上式中αi和α*i为支持向量对应的拉格朗日待定系数,第1页共3页k(xi,x)是采用的核函数[18],x为未知样本的特征矢量,xi为支持向量(拟合函数周围的ε“管壁”上的特征矢量),svs为支持向量的数目
目标值yk拟合在yk-∑svs(αi-α*i)