首页> 中国专利> 一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质

一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质

摘要

一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质,涉及自然语言处理技术领域。解决了现有生成式文本摘要技术在生成的时候并没有主动地去关注这些潜在的主题信息,导致在生成过程中失去部分重要信息的问题。所述方法包括:对新闻文本进行清理,去除所述新闻文本中无用的符号和信息;利用公开语料库进行主题模型的训练,获取主题语义矩阵;根据获取的主题语义矩阵结合深度学习神经网络建立新闻文本的专用生成式摘要模型,并利用公开数据集训练模型,获取数据集训练模型;将新闻文本的清洗步骤中处理的文本输入至数据集训练模型,利用主题信息进行指导摘要生成,获得摘要结果。本发明应用于新闻信息处理技术领域。

著录项

  • 公开/公告号CN115114428A

    专利类型发明专利

  • 公开/公告日2022-09-27

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202210673842.8

  • 申请日2022-06-15

  • 分类号G06F16/34;G06F16/953;G06F40/30;G06N3/04;G06N3/08;

  • 代理机构哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人赵艳华

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2023-06-19 16:59:43

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-27

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号