首页> 中文期刊>计算机科学 >一种基于图的文档关键词和摘要协同抽取方法研究

一种基于图的文档关键词和摘要协同抽取方法研究

     

摘要

关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括.评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖.在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词提取和摘要抽取任务协同进行的,而文中提出了一种基于图模型的方法进行关键词提取和摘要的协同抽取.该方法首先利用文档中词、主题和句子之间的6种关系,包括词和词、主题和主题、句子和句子、词和主题、主题和句子、词和句子,进行图的构建;然后利用文档中词和句子的统计特征对图中各顶点的先验重要性进行评价;接着采用迭代的方式对词和句子进行打分;最后根据词和句子的得分,得到关键词和摘要.为验证所提方法的效果,文中在中英文数据集上进行关键词提取和摘要抽取实验,发现该方法不管是在关键词提取还是摘要抽取任务上都取得了良好的效果.

著录项

  • 来源
    《计算机科学》|2021年第10期|44-50|共7页
  • 作者

    毛湘科; 黄少滨; 余秦勇;

  • 作者单位

    哈尔滨工程大学计算机科学与技术学院 哈尔滨 150001;

    中电科大数据研究院有限公司 贵阳 550022;

    提升政府治理能力大数据应用技术国家工程实验室 贵阳 550022;

    哈尔滨工程大学计算机科学与技术学院 哈尔滨 150001;

    中电科大数据研究院有限公司 贵阳 550022;

    提升政府治理能力大数据应用技术国家工程实验室 贵阳 550022;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP311.131;
  • 关键词

    提取; 摘要抽取; 图模型; 主题覆盖;

  • 入库时间 2022-08-20 08:47:21

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号