首页> 中国专利> 一种多文档自动摘要生成方法

一种多文档自动摘要生成方法

摘要

本发明公开了一种多文档自动摘要生成方法,该方法能够为同一主题下的多篇文本自动地生成一份总结性摘要。本发明首先对预设的文本摘要数据集进行预处理,得到模型训练所需的输入数据;然后构建出层次化Transformer多文档摘要生成模型,并结合三元组损失与交叉熵损失进行模型训练;最后对待处理的多篇文本进行预处理后,输入到训练完毕的摘要模型中,自动生成多篇文本的总结性摘要。与现有技术相比,本发明通过有效地结合文档内部的语义信息与文档之间的依赖关系,能够为摘要生成过程提供丰富的层次结构信息,从而提高摘要结果的上下文一致性与信息覆盖度。

著录项

  • 公开/公告号CN113468854A

    专利类型发明专利

  • 公开/公告日2021-10-01

    原文格式PDF

  • 申请/专利权人 浙江华巽科技有限公司;

    申请/专利号CN202110703934.1

  • 发明设计人 杨鹏;周华健;刘子健;李文军;

    申请日2021-06-24

  • 分类号G06F40/126(20200101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32206 南京众联专利代理有限公司;

  • 代理人杜静静

  • 地址 317609 浙江省台州市玉环市龙溪镇小山外工业园区

  • 入库时间 2023-06-19 12:46:51

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号