第7章正则化理论1、正则化基础2、良态及病态问题3、Tikhonov正则化理论4、广义径向基函数网络5、再论正则化最小二乘估计6、正则化参数估计7、半监督学习8、广义正则化理论9、光谱图理论10、拉普拉斯正则化最小二乘算法【1正则化基础】监督学习算法共同点:通过样本训练网络,对于给定的输入模式给出输出模式,等价于构造一个超平面,也就是多维映射
为了得到一条好的超平面,通常都是根据训练数据,利用最小化误差来使得更好地得到一条超平面,但是训练误差小不是我们的最终目标,我们的目标是希望模型的测试误差小,也就是能够准确地预测新的样本
但是,往往当参数太多的情况下,会导致模型复杂度上升,当在追求尽可能小的误差时就容易过拟合,过拟合从直观上理解就是在对训练数据进行拟合时,要照顾到每个点(相关特征与无关特征),从而使得拟合函数波动性非常大
那我们就希望模型“简单”一些,在这个基础上最小化训练误差,这样得到的参数才具有较好的泛化性能
这里模型的“简单”就是通过正则化函数来实现的
正则化方法:目的就是通过最小化如下的代价函数的方法把超平面重构问题的求解限制在压缩子集中:(正则化代价函数)=(经验代价函数)+(正则化参数)×(正则化项)经验代价函数:由误差平方和定义,最小化误差让模型更好地拟合训练数据;正则化算子:用来平滑超平面重构问题的解,也就是防止模型过分拟合训练数据(包括噪声和异常点)
引入正则项,在训练过程中,避免了过分依赖某一维(或几维)的特征
经典正则化理论广义正则化理论,通过引入叫做“”流行正则化算子
(半监督学习)【2病态良态问题】如果一个学习问题不具有连续性,则所计算的输入输出映射与学习问题的准确解无关
病态问题:上述三个条件中的任何一个都不满足(过拟合情况的发生)
要解决这些困难就必须附加先验知识
【3Tikhonov正则化理论】正则化的基本思想就是通过某些含有解的先验信