I问题理解增强的阅读理解方法研究Machine Reading Comprehension based on Question Understanding EnhancementI中 文 摘 要机器阅读理解是指基于给定上下文机器自动回答相应的问题[1],不仅是人工智能及自然语言处理领域的一个研究热点,更是一个挑战
机器是否正确、充分地理解问题是研究阅读理解任务的关键和基础
本文针对模型对问题理解不充分提出了相应的解决策略,主要工作如下:(1)提出一个基于多维度问题理解的阅读理解方法
本文通过问题类型识别、问题重要词识别、添加外部知识等多个维度提高模型对问题的理解
多维度问题理解的解答策略的主要思想是:a
人工标注部分数据训练一个初标注 TextCNN 模型并得到所有数据的问题类型;b
通过句法分析树和人工制定的规则获得问题的重要词;c
针对问题重要词在模型中加入外部知识;d
将之前所有的信息融入到阅读理解模型中
在 DuReader2
0 数据集上进行方法检验,融入多维度问题理解的阅读理解模型比基线模型的 Rouge-L 值和 Bleu-4 值分别提高了8,2%、7%
(2)针对隐式问题提出了相应的理解策略
我们将不包含疑问词的问句定义为隐式问题,处理此类问题的主要思想为:a
首先判断问句是否为隐式问题;b
对隐式问题进一步分为两类:一般隐式问题和复杂隐式问题;c
针对一般隐式问题,基于规则的方法添加疑问词将其转换为显式问题;针对复杂隐式问题,依据问题答案使用 TextRNN模型识别问题中缺失的疑问词并将其转换为显式问题
实验结果表明:融入隐式问题处理的阅读理解模型比基线模型的 Rouge-L 值和 Bleu-4 值分别提高了 3
6%、2%,融入隐式问题处理和多维度问题理解方法的阅读理解模型比基线模型的 Rouge-L 值和 Bleu-4 值分别提高了9