首页> 中国专利> 一种基于语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质

一种基于语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质

摘要

本发明公开了一种语篇结构的层次文本摘要获取方法、系统、终端设备及可读存储介质,所述方法包括:步骤1:将待处理的文档中句子的单词编码成词向量,并针对每个句子,利用Bi‑LSTM模型以及自注意力机制构建句子编码器得到句子向量;步骤2:针对待处理的文档,利用Bi‑LSTM模型以及自注意力机制构建篇章编码器得到篇章向量;步骤3:基于所述篇章向量对句子进行分类得到候选句子;步骤4:将候选句子输入基于RST构建的摘要提取器提取出核心EDU,并将所有候选句子的核心EDU拼接为文本摘要;其中,将候选句子分割为文档单元,再利用文本单元构成语篇结构的层次树,层次树的叶子节点EDU表示被分割的文档单元。本发明引入自注意力机制以及语篇结构提高了摘要提取的准确性。

著录项

  • 公开/公告号CN113157907B

    专利类型发明专利

  • 公开/公告日2022-05-03

    原文格式PDF

  • 申请/专利权人 中南大学;

    申请/专利号CN202110279942.8

  • 发明设计人 埃比;段俊文;王建新;刘姝玥;

    申请日2021-03-16

  • 分类号G06F16/34;G06F40/126;G06F40/146;G06F40/211;G06F40/284;G06K9/62;G06N3/04;G06N3/08;

  • 代理机构长沙市融智专利事务所(普通合伙);

  • 代理人姚瑶

  • 地址 410083 湖南省长沙市岳麓区麓山南路932号

  • 入库时间 2022-08-23 13:34:44

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-09

    专利权的转移 IPC(主分类):G06F16/34 专利号:ZL2021102799428 登记生效日:20230426 变更事项:专利权人 变更前权利人:中南大学 变更后权利人:湖南华信软件股份有限公司 变更事项:地址 变更前权利人:410083 湖南省长沙市岳麓区麓山南路932号 变更后权利人:410006 湖南省长沙市岳麓区岳麓街道麓山南路966号中国五矿麓山科创园内G4栋

    专利申请权、专利权的转移

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号