WordNetWordNet介绍介绍B.2WordNetWordNet的词汇组织结构的词汇组织结构WordNet是一部在线词典数据库系统,采用了与传统词典不同的方式,即按照词义而不是词形来组织词汇信息。1985年由普林斯顿大学认知科学实验室建立WordNet将成为一种国际标准,许多国家在筹划和建立与英文WorNet兼容的本国语言WorNet系统。B.3WordNetWordNet的词汇组织结构的词汇组织结构同义词集(Synsets)WordNet将英语的名词、动词、形容词、和副词组织为Synsets,每一个Synset表示一个基本的词汇概念,并在这些概念之间建立了包括同义关系(synonymy)、反义关系(antonymy)、上下位关系(hypernymy&hyponymy)、部分关系(meronymy)等多种语义关系。B.4WordNetWordNet的词汇组织结构的词汇组织结构同义词集(Synsets)Example:地球绕着太阳转,自然会有寒来暑往的四季交替自然奥秘{自然、必然、一定、必定}{自然、天然}B.5WordNetWordNet的词汇组织结构的词汇组织结构词汇(Words)、同义词集、语义(Senses)的数量POSUniqueStringsSynsetsTotalWord-SensePairsNoun10919575804134716Verb110881321424169Adjective214601857631184Adverb460736295748Totals146350111223195817B.6WordNetWordNet的词汇组织结构的词汇组织结构多义词信息(1)词性单义词和语义多义词多义词语义名词动词形容词副词94685592015981382014510516854797874000218221151751900总计1204062594475298B.7WordNetWordNet的词汇组织结构的词汇组织结构多义词信息(2)词性平均词义(包括单义词)平均词义名词动词形容词副词1.232.171.451.242.753.522.762.41B.8WordNetWordNet的词汇组织结构的词汇组织结构词汇的矩阵模型WordMeaningsWordFormsF1F2F3……FnM1M2M3...MmE1,1E1,2E2,2E3,3...Em,nB.9WordNetWordNet的词汇组织结构的词汇组织结构WorNet中词语间的关系主要的词汇关系同义关系(构成Synsets)反义关系(指针!)上位关系(指针@)下位关系(指针~)B.10WorNetWorNet中词语间的关系中词语间的关系整体关系(名词、指针#m/#s/#p)部分关系(名词、指针%m/%s/%p)蕴含关系(动词、指针*)因果关系(动词、指针>)近似关系(形容词、指针&)注:形容词如果是动词分词,用指针指(<)向该动词副词如果由形容词的派生而来,用指针(\)指向该形容词。B.11WorNetWorNet中词语间的关系中词语间的关系同义关系(synonymy)WordNet用同义词集表示概念,最重要的关系就是同义关系。如果两种表达方式在语言文本中相互替代而不改变其意义,则着两种表达就是同义的。例如:{heavy,weighty,ponderous}{light,weightless,airy}B.12WorNetWorNet中词语间的关系中词语间的关系反义关系(antonymy)反义关系不是WordNet的基本组织关系。反义关系是一种词形关系,不是概念之间的语义关系。例如下面的反义词对:男人女人上升/下降升高/下落heavy/lightweighty/weightlessB.13WorNetWorNet中词语间的关系中词语间的关系形容词的反义关系•描述性形容词的语义组织方式与名词完全不同,采用N维超空间结构,而不是树形的层次结构。•描述性形容词的基本语义关系是反义关系。•形容词的同义词集用形容词簇表示•形容此词簇通过反义关系联系在一起。例如:•ponderous的语义近似于(similarto)heavy•直接反义词对(light/heavy)•间接反义词对(light/ponderous)B.14WorNetWorNet中词语间的关系中词语间的关系形容词簇B.15WorNetWorNet中词语间的关系中词语间的关系上下位关系(hypermymy&hyponymy)上下位关系是词汇之间的语义关系。例如:{枫树}是{树}的下位词,{树}是{植物}的下位词上下位关系也称为从属/上属关系,子集/超集关系,或ISA关系。上下位关系不是一种对称关系,通常一个同义词集只有唯一的上位,而下位却很多。B.16WorNetWorNet中词语间的关系中词语间的关系名词的上下位关系•名词的组织依照上下位关系构造名词语义树•名词的继承系统,构成一种层次关系(hierarchies)例如,橡树@--->树@--->植物@--->生物•下位词汇的词条继承了他们上位词汇的所有属性(attributes)•名词的语...