机器翻译中基于语法、语义知识库的汉语词义消歧策略王惠北京大学计算语言学研究所,北京,100871摘要:词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高
但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题
本文认为,要真正有效地提高词义知识库的质量,需要在词类划分基础上,增加词义的语法功能分析和语义搭配限制,综合利用现有的语法语义资源,提取多义词的每个意义在不同层级上的各种分布特征
以此为基础,本文提出了一种汉英机器翻译系统中基于语法、语义知识库的汉语词义消歧分析算法
初步的实验结果表明,该方法可以高质量地进行汉语名词、动词、形容词的词义消歧
关键词:词义消歧(WSD)汉英机器翻译语法词典语义词典AStudyofChineseWordSenseDisambiguationinMTBasedonGrammatical&SemanticKnowledge-basesWang,Hui(InstituteofComputationalLinguistics,PekingUniversity,Beijing100871,China)AbstractWordsensedisambiguation(WSD)playsanimportantroleinMachineTranslationandmanyotherareasofnaturallanguageprocessing
TheresearchonWSDhasgreattheoreticalandpracticalsignificance
ThemainworkinthispaperistostudywhatkindofknowledgeisusefulforWSDinsystem,andestablishamulti-levelWSDmodelbasedon