ICLR 2022 EntQA | 实体链接看作问答-伙伴云

ICLR 2022 EntQA | 实体链接看作问答

网友投稿 952 2022-05-29

论文：Zhang W, Hua W, Stratos K. EntQA: Entity Linking as Question Answering[J]. arXiv preprint arXiv:2110.02369, 2021.

链接：https://arxiv.org/pdf/2110.02369.pdf

代码：https://github.com/WenzhengZhang/EntQA

0、摘要

实体链接（EL）传统方法：先提及，后实体

局限性：不知道实体的情况下，先找提及，不自然

EntQA：用问答来解决实体链接

检索器：快速找出候选实体

阅读器：找到每个实体的提及

结合实体链接、开放域问答的进展，以及预训练模型方法，密集实体检索+阅读理解

不依赖<提及-候选>词典和大规模弱监督

1、介绍

EL的一般形式：抽取实体提及、链接提及到KG里面的实体

EL是自动文本理解任务的基建，应用于问答、信息检索、商业推荐系统等

EL的输出空间非常大，文档里的提及链接的候选实体通常是百万级

现有方法：EL 分成提及检测 MD 和实体消歧 ED，然后独立解决

1）MD → ED，以前的工作是假设提及被给定，跑现成的NER模型，抽取提及；

2）训练一个端到端的模型，联合执行，通过术搜索进行ED；

MD → ED：要求不知道相关实体的情况下，找到提及

提及的定义：实体的指称，先有的实体，后有的提及

span的抽取依赖第三方NER系统，错误传播（端到端模型缓解不了这个困境）

本文工作：ED → MD（翻转两个任务的顺序）

先找到文档中可能提到的候选实体，然后为每个实体找到其提及

困难：不知道图谱相关实体，找提及

容易：不知道实体提及，找相关实体

将问题看作是倒置的开放域QA

ICLR 2022 EntQA | 实体链接看作问答

给定一个文档，使用一个双编码器检索器，检索top-K候选实体，作为“问题”

然后，使用一个深度交叉注意力阅读器，识别每个候选的提及，作为“答案区间”

必须预测未知数量的问题和答案，基于阈值解决

EntQA优势

可以利用密集实体搜索和开放域QA的最新进展（BLINK实体检索器、微调ELECTRA）

不依赖<提及-候选>词典

训练EntQA，数据高效，学术预算足够

2、方法

检索器（

FAQ

）

相似度得分 = 段落编码 * 实体编码

阅读器（

MRC

）

编码（[CLS]段落[SEP]实体[SEP]），MRC模型，预测提及开始和结束位置

提及区间的概率

实体出现的概率

推理

1、检索top-K候选实体

2、每个候选实体，抽取top-P个候选提及区间

3、实体概率 * 区间概率，排序

3、结果

号外号外：想了解更多的AI技术干货，欢迎上华为云的AI专区，目前有AI编程Python等六大实战营供大家免费学习。

机器学习知识图谱自然语言处理基础

突击：2022最全Spark面试体系(1万字，60长图，30+知识点)">年前突击：2022最全Spark面试体系(1万字，60长图，30+知识点)

952 2022-05-29

2022-0847 DirtyPipe漏洞分析">CVE-2022-0847 DirtyPipe漏洞分析

952 2022-05-29

2022wps怎么选2010office版本（怎么把2010office变成2019）

952 2022-05-29

ICLR 2022 EntQA | 实体链接看作问答

突击：2022最全Spark面试体系(1万字，60长图，30+知识点)">年前突击：2022最全Spark面试体系(1万字，60长图，30+知识点)

2022-0847 DirtyPipe漏洞分析">CVE-2022-0847 DirtyPipe漏洞分析

2022wps怎么选2010office版本（怎么把2010office变成2019）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

家居定制平台是什么？">家居定制平台是什么？

友情链接

ICLR 2022 EntQA | 实体链接看作问答

微信扫一扫：分享

突击：2022最全Spark面试体系(1万字，60长图，30+知识点)">年前突击：2022最全Spark面试体系(1万字，60长图，30+知识点)

2022-0847 DirtyPipe漏洞分析">CVE-2022-0847 DirtyPipe漏洞分析

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

家居定制平台是什么？">家居定制平台是什么？

友情链接