摘要半监督学习利用大量未标记数据结合少量标记数据提升学习性能
本文涉及几种半监督分类方法的评价
文章由三个主要部分组成
首先,介绍半监督学习的定义和基本假设;第二部分为本文的主体部分,介绍了四种半监督学习方法:弱监督学习、生成模型、直推式支持向量机、基于图的方法,结合数据集对其优势和缺陷进行评价;在第三部分中,本文从理论上分析了未标记数据对分类性能提升的作用
关键词:半监督学习分类生成模型直推式支持向量机基于图的方法AbstractSemi-supervisedlearningusesalargeamountofunlabeleddata,togetherwiththelabeleddatatobuildabetterclassifier
Thispaperisconcernedwiththeevaluationofseveralsemi-supervisedmethods
Therearethreemajoringredients
Thefirstisanintroductiononthedefinitionandsomepopularassumptionsofsemi-supervisedlearning
Thesecond,whichisthemainingredientofthispaper,studiesthefourmainsemi-supervisedmethods,includingweaklysupervisedmethods,generativemodel,transductivesupportvectormachineandgraph-basedmethods
Someexperimentsondatasetsofthesemethodshavebeencarriedout,tocharacterizetheiradvantagesandlimitat