目录前言1第一章绪论21
1研究背景及意义21
2问答系统概述31
3本文的主要工作41
4本文的组织结构5第二章问答系统实现方法62
1问答系统实现方法62
2问题分析72
1问题预处理72
2问题分类72
3关键字提取82
3信息检索82
4答案抽取9第三章问答系统算法设计113
1Lucene113
2相似度计算113
1词向量123
2卷积神经网络133
3Word2vec143
3排序学习15第四章模版匹配方法174
1问题模版174
2模版构建174
21后缀树174
22模版获取194
23准确度计算204
3问题分类21朴素贝叶斯方法214
4评估方法21第五章总结与展望235
1本文总结235
2后续工作展望23参考文献24致谢26摘要问答系统的主要任务是在信息抽取文档的支持下,提供给自然语言表述的问题一个简单有效的答案,实现友好可靠的人机交互方式,现有的技术已经能够基本实现部分问答需求
在本文中,我们将讨论基本的问答系统的实现结构和工作方式,并分析一种使用模版学习的问题匹配和答案抽取方法
问题模版通过提供一些人工问题的实例输入搜索引擎,建立了一个带标签的语料库,从返回的文件中抽取并标准化得
我们可以通过MRR得分评估每个模版的精准度,确定每个问题类型的回答效果
在获得高精度的模版后可以应用于匹配新问题的答案
答案抽取的相关度计算采用基于词向量模型的排序学习方法
排序学习是机器学习的典型应用,用于构建信息检索系统的学习排序模型
训练数据由查询得到的文档指定的部分文档列表组成
排序学习的目的确定是在新问题提出时文档列表中已有的内容与问题请求是否有关
关键字:问答系统;模板学习;问题匹配;答案抽取;排序学习AbstractThemajortaskofthequestionansweringsystemistoprovideasimple