下载后可任意编辑【平安金融壹账通获机器阅读理解顶级赛事(SQuAD)世界第一】父亲的大账阅读理解 平安金融壹账通又有重大突破!继在人类情绪理解竞赛多次登顶之后,平安金融壹账通 GammaLab 又在另一项国际顶级赛事上斩获第一。近日,在由斯坦福大学发起的机器阅读理解竞赛(StanfordQuestionAnsweringDataset,SQuAD)中,平安金融壹账通以领先的技术脱颖而出,位列榜单第一位。 SQuAD 被誉为自然语言处理领域金字塔尖的竞赛,旨在促进智能搜索引擎的进展。该赛事吸引了来自谷歌、微软亚研院、阿里达摩院、科大讯飞、IBM 以及复旦大学等最顶尖的企业及学校的激烈角逐。平安金融壹账通 GammaLab 以集成模型EM=83.435%、F1=85.992%和单模型 EM=81.347%、F1:84.560%分别位列集成模型和单模型世界第一。 SQuAD 机器阅读理解竞赛,是让机器阅读一篇文章,然后回第 1 页 共 4 页下载后可任意编辑答关于这篇文章的任何问题,旨在推动智能搜索的进展。2024年,斯坦福大学从维基百科上随机选取了 500 多篇文章,并进一步细分成两万多个段落。随后采纳众包的方式,由人类阅读这些文章后,为每个段落提出五个问题,并对段落内的答案进行人工标注,搭建了该项竞赛的数据集 1.1。今年 6 月 3 日,斯坦福 NLP团队对外宣称,机器阅读理解数据集 1.1 完成一波更新,已搭建完成 SQuAD2.0。相较于 SQuAD1.1 中的 10 万问答,SQuAD2.0 又新增了 5 万个人类撰写的问题,而且问题不一定有对应答案。参考下图: 在 SQuAD1.1 数据集当中,阅读理解的主要难点是上下文的语义理解。所提问题的答案并不能靠简单的近邻或相似度对答案进行匹配,而是需要通过 NLP 的语义分析,在考虑前后文信息后从全文中寻找到最合适的答案位置。想要做好这一点,需要算法能力达到人类阅读理解的思考水平。在此基础上,SQuAD2.0第 2 页 共 4 页下载后可任意编辑中新增的无答案的混淆问题进一步提升了该任务的难度。一个问题所对应的段落中有一定概率不存在正确结果,即要算法推断是否能够回答,并在此基础上准确回答问题。可以说 SQuAD 数据集 2.0 的任务在不断逼近人类阅读理解的思考方式,同时也大幅提高了竞赛的难度。金融壹账通 GammaLab 在本次竞赛中所获得的成绩,已经非常接近人类水平,体现了世界最高水平的智能搜索能力。 早在今年年初,平安金融壹账通就已经谋划布局基于机器阅读理解技术的商业落地其,自主研发的 AskBob 智能搜索框架,使用了最先进的机器阅读理解...