电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

特征选择常用算法综述

特征选择常用算法综述_第1页
1/14
特征选择常用算法综述_第2页
2/14
特征选择常用算法综述_第3页
3/14
特征选择常用算法综述 1 综述 (1 ) 什么是特征选择 特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。 (2 ) 为什么要做特征选择 在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果: Ø 特征个数越多,分析特征、训练模型所需的时间就越长。 Ø 特征个数越多,容易引起“维度灾难”,模型也会越复杂,其推广能力会下降。 特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化了模型,使研究人员易于理解数据产生的过程。 2 特征选择过程 2 .1 特征选择的一般过程 特征选择的一般过程可用图 1 表示。首先从特征全集中产生出一个特征子集,然后用评价函数对该特征子集进行评价,评价的结果与停止准则进行比较,若评价结果比停止准则好就停止,否则就继续产生下一组特征子集,继续进行特征选择。选出来的特征子集一般还要验证其有效性。 综上所述,特征选择过程一般包括产生过程,评价函数,停止准则,验证过程,这4 个部分。 (1) 产生过程( Generation Procedure ) 产生过程是搜索特征子集的过程,负责为评价函数提供特征子集。搜索特征子集的过程有多种,将在 2.2 小节展开介绍。 (2) 评价函数( Evaluation Function ) 评价函数是评价一个特征子集好坏程度的一个准则。评价函数将在 2.3 小节展开介绍。 (3) 停止准则( Stopping Criterion ) 停止准则是与评价函数相关的,一般是一个阈值,当评价函数值达到这个阈值后就可停止搜索。 (4) 验证过程( Validation Procedure ) 在验证数据集上验证选出来的特征子集的有效性。 图 1. 特征选择的过程 ( M. Dash and H. Liu 1997 ) 2.2 产生过程 产生过程是搜索特征子空间的过程。搜索的算法分为完全搜索(Complete),启发式搜索(Heu ristic),随机搜索(Random) 3 大类,如图 2 所示。 图 2. 产生过程算法分类 ( M. Dash and H. Liu 1997 ) 下面对常见的搜索算法进行简单介绍。 2.2.1 完全搜索 完全搜索分为穷举搜索(Ex hau stiv e)与非穷举搜索(Non-Ex hau stiv e)两类。 (...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

特征选择常用算法综述

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部