首页> 中国专利> 一种基于递归神经网络的文本语言关联抽取方法和系统

一种基于递归神经网络的文本语言关联抽取方法和系统

摘要

本发明公开一种基于递归神经网络的文本语言关联抽取方法和系统。该方法基于递归神经网络(双向长短期记忆网络)自动提取复杂的上下文特征,对上下文的语义信息进行编码;通过基于规则的实体表述对抽取器发现文档内的定义模式,识别文档内部关于非标准表述的定义,并抽取定义的从属于同一个实体概念的标准表述与非标准表述;将抽取到的实体表述对的特征进行编码,把关于实体归一化的信息嵌入到低维的实体表述向量;实体表述向量与上下文特征编码向量联结起来并进行维度转换得到最终的编码;基于条件随机场的解码器结合编码器学习到的特征与状态之间的转移概率,解码出全局最优的状态序列作为最终的输出序列。本发明能够有效提升实体识别的性能。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-28

    实质审查的生效 IPC(主分类):G06F40/295 申请日:20181226

    实质审查的生效

  • 2020-07-03

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号