下载后可任意编辑【平安金融壹账通获机器阅读理解顶级赛事(SQuAD)世界第一】父亲的大账阅读理解 平安金融壹账通又有重大突破
继在人类情绪理解竞赛多次登顶之后,平安金融壹账通 GammaLab 又在另一项国际顶级赛事上斩获第一
近日,在由斯坦福大学发起的机器阅读理解竞赛(StanfordQuestionAnsweringDataset,SQuAD)中,平安金融壹账通以领先的技术脱颖而出,位列榜单第一位
SQuAD 被誉为自然语言处理领域金字塔尖的竞赛,旨在促进智能搜索引擎的进展
该赛事吸引了来自谷歌、微软亚研院、阿里达摩院、科大讯飞、IBM 以及复旦大学等最顶尖的企业及学校的激烈角逐
平安金融壹账通 GammaLab 以集成模型EM=83
435%、F1=85
992%和单模型 EM=81
347%、F1:84
560%分别位列集成模型和单模型世界第一
SQuAD 机器阅读理解竞赛,是让机器阅读一篇文章,然后回第 1 页 共 4 页下载后可任意编辑答关于这篇文章的任何问题,旨在推动智能搜索的进展
2024年,斯坦福大学从维基百科上随机选取了 500 多篇文章,并进一步细分成两万多个段落
随后采纳众包的方式,由人类阅读这些文章后,为每个段落提出五个问题,并对段落内的答案进行人工标注,搭建了该项竞赛的数据集 1
今年 6 月 3 日,斯坦福 NLP团队对外宣称,机器阅读理解数据集 1
1 完成一波更新,已搭建完成 SQuAD2
相较于 SQuAD1
1 中的 10 万问答,SQuAD2
0 又新增了 5 万个人类撰写的问题,而且问题不一定有对应答案
参考下图: 在 SQuAD1
1 数据集当中,阅读理解的主要难点是上下文的语义理解
所提问题的答案并不能靠简单的近邻或相似度对答案进行匹配,而是需要通过 NLP 的语义分析,在考虑前后文信息后从全文中寻找到最合适的答案位