首页> 中国专利> 一种基于神经网络的双向多段落阅读零样本实体链接方法和装置

一种基于神经网络的双向多段落阅读零样本实体链接方法和装置

摘要

本发明涉及一种基于神经网络的双向多段落阅读零样本实体链接方法和装置,属于自然语言分析领域。在零样本实体链接中,实体的指称必须链接到训练集中没有见过的实体,并且只能利用文本信息。本发明构造了基于预训练语言模型的神经网络模型,首先基于数据集中的文本进行语言模型预训练,获得文本的表示,然后通过实体指称的上下文匹配不同实体的多个段落的描述,充分利用分散在不同段落的文本匹配信息。更进一步,考虑到实体指称所在的文本也包含多个段落的信息,模型再次使用上一步得到的信息来匹配多个实体指称的段落,从而构成双向的阅读匹配。基于这样的机制,本发明不仅可以迁移到多个领域的文本,而且可以充分利用不同的段落之间的匹配信息。

著录项

  • 公开/公告号CN112732862B

    专利类型发明专利

  • 公开/公告日2021-11-09

    原文格式PDF

  • 申请/专利权人 中国科学院软件研究所;

    申请/专利号CN202011562089.2

  • 发明设计人 唐弘胤;金蓓弘;

    申请日2020-12-25

  • 分类号G06F16/31(20190101);G06F16/33(20190101);G06F40/289(20200101);G06F40/30(20200101);G06N3/02(20060101);G06N3/08(20060101);

  • 代理机构11200 北京君尚知识产权代理有限公司;

  • 代理人邱晓锋

  • 地址 100190 北京市海淀区中关村南四街4号

  • 入库时间 2022-08-23 12:46:08

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号