您现在的位置: 首页> 研究主题> 自动摘要

自动摘要

自动摘要的相关文献在1996年到2022年内共计206篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究 等领域,其中期刊论文126篇、会议论文11篇、专利文献1352347篇;相关期刊87种,包括情报学报、情报杂志、现代图书情报技术等; 相关会议11种,包括2014湖北省计算机学会学术年会、第十三届海峡两岸智能运输系统学术研讨会、2009年中国信息技术应用学术研讨会等;自动摘要的相关文献由493位作者贡献,包括王健、王永成、伍之昂等。

自动摘要—发文量

期刊论文>

论文:126 占比:0.01%

会议论文>

论文:11 占比:0.00%

专利文献>

论文:1352347 占比:99.99%

总计:1352484篇

自动摘要—发文趋势图

自动摘要

-研究学者

  • 王健
  • 王永成
  • 伍之昂
  • 崔志明
  • 张璐
  • 周玉
  • 安见才让
  • 张向先
  • 张莉曼
  • 张铭
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 李栋凯; 张永昌
    • 摘要: 将textrank、word2vec和MMR3种语言模型用于基于文本相似度的新闻自动摘要提取。实验结果表明textrank算法得到的摘要语句可读性较差,理解困难;在textrank算法基础上增加word2vec模型后对整篇新闻的概括度较高,但却不能很好地解决信息冗余和效率低的问题;MMR可以有效去除信息冗余,体现语义的多样性。
    • 刘翠兰; 张嘉元; 曹旭栋; 伍高飞; 朱笑岩; 任家东; 冯涛
    • 摘要: 在开源软件开发的维护阶段,开源软件缺陷报告为开发人员解决缺陷提供了大量帮助。然而,开源软件缺陷报告通常是以用户对话的形式编写,一个软件缺陷报告可能含有数十条评论和上千个句子,导致开发人员难以阅读或理解软件缺陷报告。为了缓解这个问题,人们提出了开源软件缺陷报告自动摘要,缺陷报告自动摘要可以减少开发人员阅读冗长缺陷报告的时间。本文以综述的方式对开源软件缺陷报告自动摘要的研究做了系统的归纳总结。首先,根据摘要的表现形式,将开源软件缺陷报告摘要分类为固定缺陷报告摘要和可视化缺陷报告摘要,再将固定缺陷报告摘要研究方法分类为基于监督学习方法和基于无监督学习方法,之后总结了基于监督学习和无监督学习的开源软件缺陷报告摘要生成的工作框架,并介绍了开源软件缺陷报告摘要领域常用数据集、预处理技术和摘要评估指标。其次,本文以无监督学习为切入点,分类阐述和归纳了无监督开源软件缺陷报告摘要方法,将无监督开源软件缺陷报告摘要方法分类为:基于特征评分方法、基于深度学习方法、基于图方法和基于启发式方法,并对每类方法进行讨论与分析。再次,从缺陷报告摘要的实用性出发,对现有的缺陷报告可视化摘要研究成果进行总结,并对固定缺陷报告摘要和可视化缺陷报告摘要的实用性做出分析。最后,对现有研究成果及综述进行讨论和分析,指出了开源软件缺陷报告摘要领域在缺陷报告数据集、抽取式摘要和黄金标准摘要三个方面面临的挑战和对未来研究的展望。
    • 徐润华; 王东波; 刘欢; 梁媛; 陈康
    • 摘要: 能降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究很少。文章面向《资治通鉴》语料,基于SikuBERT预训练模型进行自动摘要实验,并对比其与传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现。实验结果表明:基于SikuBERT预训练模型生成的摘要结果在稳定性、覆盖度等方面较好;通过专家人工打分方式,基于SikuBERT预训练模型生成的摘要结果平均得分最高。实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用SikuBERT预训练模型对古文进行信息处理的适用性。
    • 陈红
    • 摘要: 由于文本中事件之间的时序关系可以帮助人们更好地理解文本内容,故针对新闻报道类文本,将事件作为其基本语义单元,并根据时序关系建立事件有向网络文本表示模型;利用Pag-eRank算法结合主题相关度对时序网络进行节点重要度计算及调整;最后,按照重要度以及事件发生的顺序进行排序,并按照一定的压缩比提取摘要句,删除冗余的句子,将事件对应的原语句作为摘要.实验结果表明,基于事件时序关系的自动摘要方法效果较好.
    • 祁荣苓; 焦文彬; 汪洋
    • 摘要: 【目的】随着“互联网+电子政务”的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策。本文旨在研究一种适合电子政务文档的自动摘要算法。【方法】本文针对电子政务资讯文本的特点提出了一种融合Doc2Vec句子向量表示方法和模糊均值聚类方法的算法并应用在电子政务资讯文档的自动摘要生成中,不仅考虑句子之间的相关度,而且针对文章的特点对于每个句子赋予一定的权重来表示他作为摘要句子的重要性。【结果】实验表明,相较于目前常用的k-means算法结果和复杂的深度学习算法结果,该算法在电子政务资讯文档的自动生成取得了比较好的结果。【结论】研究自动摘要技术并在电子政务领域应用是一项很有价值的工作。
    • 祁荣苓; 焦文彬; 汪洋
    • 摘要: [目的]随着"互联网+电子政务"的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策.本文旨在研究一种适合电子政务文档的自动摘要算法.[方法]本文针对电子政务资讯文本的特点提出了一种融合Doc2Vec句子向量表示方法和模糊均值聚类方法的算法并应用在电子政务资讯文档的自动摘要生成中,不仅考虑句子之间的相关度,而且针对文章的特点对于每个句子赋予一定的权重来表示他作为摘要句子的重要性.[结果]实验表明,相较于目前常用的k-means算法结果和复杂的深度学习算法结果,该算法在电子政务资讯文档的自动生成取得了比较好的结果.[结论]研究自动摘要技术并在电子政务领域应用是一项很有价值的工作.
    • 王义真; 欧石燕; 陈金菊
    • 摘要: [目的]针对民事一审裁判文书内容进行文本自动摘要,为裁判文书的用户提供简练可读、连贯通顺和准确高效的摘要文本.[方法]提出一种面向裁判文书自动摘要的新方法,该方法由抽取式摘要和生成式摘要两个阶段构成.在第一阶段抽取式摘要中,在预训练模型的基础上加入膨胀残差门控卷积神经网络进行裁判文书关键句子抽取得到抽取式文摘;在第二阶段生成式摘要中,将抽取式文摘作为模型的输入,通过序列到序列模型生成最终的裁判文书摘要.[结果]本文所提模型在裁判文书自动摘要实验中的ROUGE指标分别是50.31、36.60、48.86,较基准模型LEAD-3分别提高25.00、23.25、24.66.[局限]将第一阶段得到的抽取式摘要作为第二阶段生成式模型的输入,存在模型的累计误差,模型的整体效果受到第一阶段抽取式模型的影响.[结论]本文模型可以有效地应用在裁判文书自动摘要服务中,解决裁判文书信息过载问题,为裁判文书用户提供了一种快速阅读裁判文书、获取知识的新途径.
    • 王义真; 欧石燕; 陈金菊
    • 摘要: 【目的】针对民事一审裁判文书内容进行文本自动摘要,为裁判文书的用户提供简练可读、连贯通顺和准确高效的摘要文本。【方法】提出一种面向裁判文书自动摘要的新方法,该方法由抽取式摘要和生成式摘要两个阶段构成。在第一阶段抽取式摘要中,在预训练模型的基础上加入膨胀残差门控卷积神经网络进行裁判文书关键句子抽取得到抽取式文摘;在第二阶段生成式摘要中,将抽取式文摘作为模型的输入,通过序列到序列模型生成最终的裁判文书摘要。【结果】本文所提模型在裁判文书自动摘要实验中的ROUGE指标分别是50.31、36.60、48.86,较基准模型LEAD-3分别提高25.00、23.25、24.66。【局限】将第一阶段得到的抽取式摘要作为第二阶段生成式模型的输入,存在模型的累计误差,模型的整体效果受到第一阶段抽取式模型的影响。【结论】本文模型可以有效地应用在裁判文书自动摘要服务中,解决裁判文书信息过载问题,为裁判文书用户提供了一种快速阅读裁判文书、获取知识的新途径。
    • 费宗翔; 田鹏
    • 摘要: 上海市教育委员会教学研究室在多年的课程与教学调研工作中积累了大量的调研报告,这些报告大多是文档格式,数量多、语义描述方式多样、内容表征意义模糊,如何快速、直观地把握文本的语义是一个难题.自然语言处理技术经过多年的发展,在自动摘要、信息抽取等方面发挥了重要的作用.介绍了自然语言处理技术在课程与教学调研报告语义分析中的应用,阐述了在分词库扩充、文章主题词抽取、自动摘要提取等方面的实践研究.
    • 周蔚; 王兆毓; 魏斌
    • 摘要: 当前面向中文内容的自动摘要模型应用于法律裁判文书时,主要采用抽取式方法进行摘要.但由于法律文本比较冗长、结构化程度较低,抽取式摘要的精准度和可靠性有所欠缺.为了获得法律裁判文书的高质量文本摘要,文中提出了一种生成式多模型融合的自动摘要方法.在Seq2Seq模型的基础上,引入注意力(attention)机制,同时通过Bert预训练和强化学习等方法,结合选择门技术,提出了BASR(Bert Based Attention Seq2Seq Reinforced Model)模型.将50000篇法律裁判文书作为语料,以小额诉讼和简易程序类型的裁判文书为代表性研究对象,实验结果证明新模型有较好的效果,在ROUGE评价中相比传统的Seq2Seq+Attention模型取得了均值5.81%的性能提升.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号