首页> 中文期刊>中文信息学报 >基于序列模型的单文档标题生成研究

基于序列模型的单文档标题生成研究

     

摘要

中文单文档摘要是把一篇文档压缩成一个更短描述的过程.随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值.但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题.该文提出基于关键信息指导的标题生成算法.算法中的关键信息除了主流方法中使用的新闻首段句子之外,还包括新闻后续内容中有实质信息的句子,以及新闻中的重点词语.该算法将这些关键信息作为序列模型的输入,指导其生成标题,使得生成的标题能够覆盖更多的新闻信息.实验表明,在基于序列模型生成标题时,使用关键信息能够提升新闻标题生成的效果.

著录项

  • 来源
    《中文信息学报》|2021年第1期|64-71|共8页
  • 作者单位

    中国科学院大学 北京100049;

    中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室 北京100190;

    中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室 北京100190;

    中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室 北京100190;

    中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室 北京100190;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    单文档; 标题生成; 序列模型;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号