基于概念间边权重的概念相似性计算方法文章编号:1001-9081(2012)01-0202-04doi:10
3724/sp
00202摘要:介绍了传统的基于距离的相似度计算方法,针对其在距离计算中包含语义信息不充足的现状,提出了一种改进的使用wordnet的基于概念之间边的权重的相似性度量方法
该方法综合考虑了概念在词库中所处层次的深度和密度,即概念的语义丰富程度,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题
实验结果表明,所提方法在rubenstein数据集上与人工判断有着0
9109的相关性,与其他经典的相似性计算方法相比有着更高的准确性
关键词:概念相似度计算;wordnet;边权重;语义信息中图分类号:tp393
08文献标志码:aabstract:thetraditionaldistance-basedsimilaritycalculationmethodwasdescribed
concerningthatthemethodofdistancecalculationdoesnotcontainsufficientsemanticinformation,thispaperproposedanimprovedmethodwhichusedwordnetandedgeweightinginformationbetweentheconceptstomeasurethesimilarity
itconsideredthelevelofdepthanddensityofconceptsincorpus,i
thesemanticrichnessofconcept
usingthismethod,theauthorscansolvethesemanticsimilarit