目录前言...........................................................................................................5第一章绪论..............................................................................................61.1研究背景.......................................................................................61.2论文的内容及意义.......................................................................71.3本文的组织结构...........................................................................9第二章技术综述....................................................................................102.1PageRank.....................................................................................102.2MapReduce..................................................................................102.3Wordembedding..........................................................................112.3.1单一编码词向量...............................................................112.3.2分布式词向量...................................................................112.3.3本文对词向量技术的使用...............................................122.4数据集及存储.............................................................................122.5倒排索引.....................................................................................13第三章基于知识图谱的文献推荐算法................................................143.1主流相关算法介绍.....................................................................143.2算法概要.....................................................................................15第四章实验与统计................................................................................214.1数据集与实验方法.....................................................................214.1评估流程.....................................................................................214.2实验结果.....................................................................................214.3开发环境及使用工具.................................................................23第五章总结与展望................................................................................255.1总结.............................................................................................255.2未来的展望.................................................................................25参考文献..................................................................................................27致谢..........................................................................................................28摘要科研工作者在进行论文写作的过程中有一个环节无法避免,即参考文献的查找与引用。而随着计算机与网络技术的发展,当前的主流方法已经从纸质文献的低效查询转变为通过网络向文献索引机构通过关键词的方式进行在线查询。因此,本文提出了一种基于知识图谱的混合型文献推荐算法,减少用户查询相关文献时需要的操作次数,向用户返回更加有效优质的文献查询结果。本文提出的算法的优势在于:(1)利用了知识图谱来挖掘更多文献之间隐含的信息,如文献的相对重要性,文献作者对文献的影响等;(2)利用词向量来衡量论文之间的内容相关性,作为论文推荐的考虑因素之一;(3)考虑了论文与引文的发表时间之间的关系,避免大量推荐过时但被大量引用的论文;(4)利用神经网络训练了一个混合式的推荐模型,来综合各类参考因素。本文在DBLP文献数据集上进行了实验,最终在2000大小的测试集上得到的准确率为8....