第5章特征提取和选择5
2基本概念5
3类别可分性判据5
4基于可分性判据的特征提取5
5主分量分析(PCA)在模式识别领域,特征的提取与选择是最关键的问题之一,同时也是最困难的问题之一
不同的模式识别应用,需要采用不同的特征提取与选择方法
对于实际的模式识别问题,以人脸识别为例,一开始的原始特征可能很多,如在人脸数据库中,每幅图像的分辨率为11292,即高达10304维
若把所有的原始特征都作为分类特征送到分类器,不仅使得分类器复杂,分类判别计算量大,而且分类错误概率也不一定小;原始特征的特征空间有很大的冗余,完全可以用很小的空间相当好地近似表示图像,这一点与压缩的思想类似
因此有必要减少特征数目,以获取“少而精”的分类特征,即获取特征数目少且能使分类错误概率小的特征向量
模式识别中减少特征数目(或压缩特征空间)的方法有两种:一种是特征提取,另一种是特征选择
1引言在模式识别系统中,确定分类和学习过程所使用的特征是非常重要的一个环节,获得对分类最有效的特征,同时尽最大可能减少特征维数,是特征选取的主要任务
特征选取可以分成原始特诊的采集和转换、有效特征的生成两个步骤
原始特征:通过直接测量得到的特征称为原始特征
比如人体的各种生理指标(描述其健康状况);数字图像中的每点灰度值(以描述图像内容),都是原始特征
特征提取:通过映射(变换)的方法把高维的特征向量变换为低维的特征向量
通过特征提取获得的特征是原始特征集的某种组合,即A:X→Y,可见新的特征中包含有原有全体特征的信息
特征选择:从原始特征中挑选出一些最有代表性、分类性能好的特征以达到降低特征空间维数的目的
也就是说,特征选择就是从已有的D个原始特征中挑选出d个特征组成一个特征子集,同时将D-d个对类别可分离性无贡献的或贡献不大的特征简单地忽略掉
特征提取与具体问题有很大关系,目前没有理论能给出对任何