自动摘要
自动摘要的相关文献在1996年到2022年内共计206篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文126篇、会议论文11篇、专利文献1352347篇;相关期刊87种,包括情报学报、情报杂志、现代图书情报技术等;
相关会议11种,包括2014湖北省计算机学会学术年会、第十三届海峡两岸智能运输系统学术研讨会、2009年中国信息技术应用学术研讨会等;自动摘要的相关文献由493位作者贡献,包括王健、王永成、伍之昂等。
自动摘要—发文量
专利文献>
论文:1352347篇
占比:99.99%
总计:1352484篇
自动摘要
-研究学者
- 王健
- 王永成
- 伍之昂
- 崔志明
- 张璐
- 周玉
- 安见才让
- 张向先
- 张莉曼
- 张铭
- 曹杰
- 章彦星
- 赵亚慧
- 陈晨
- 陶兴
- 丁建立
- 买买提依明·哈斯木
- 伍星
- 何中市
- 何洪波
- 余啸
- 余正涛
- 储玮
- 刘传汉
- 刘健博
- 刘全
- 刘军
- 刘成林
- 刘智满
- 刘进
- 卜湛
- 史景伦
- 叶娜
- 叶昭晖
- 吴世鑫
- 吴玉芳
- 吾守尔·斯拉木
- 周平义
- 唐建权
- 唐素勤
- 奚雪峰
- 孙健
- 孙庆华
- 崔荣一
- 庄浩杰
- 庄越挺
- 张亚飞
- 张占江
- 张恒
- 张明
-
-
李栋凯;
张永昌
-
-
摘要:
将textrank、word2vec和MMR3种语言模型用于基于文本相似度的新闻自动摘要提取。实验结果表明textrank算法得到的摘要语句可读性较差,理解困难;在textrank算法基础上增加word2vec模型后对整篇新闻的概括度较高,但却不能很好地解决信息冗余和效率低的问题;MMR可以有效去除信息冗余,体现语义的多样性。
-
-
刘翠兰;
张嘉元;
曹旭栋;
伍高飞;
朱笑岩;
任家东;
冯涛
-
-
摘要:
在开源软件开发的维护阶段,开源软件缺陷报告为开发人员解决缺陷提供了大量帮助。然而,开源软件缺陷报告通常是以用户对话的形式编写,一个软件缺陷报告可能含有数十条评论和上千个句子,导致开发人员难以阅读或理解软件缺陷报告。为了缓解这个问题,人们提出了开源软件缺陷报告自动摘要,缺陷报告自动摘要可以减少开发人员阅读冗长缺陷报告的时间。本文以综述的方式对开源软件缺陷报告自动摘要的研究做了系统的归纳总结。首先,根据摘要的表现形式,将开源软件缺陷报告摘要分类为固定缺陷报告摘要和可视化缺陷报告摘要,再将固定缺陷报告摘要研究方法分类为基于监督学习方法和基于无监督学习方法,之后总结了基于监督学习和无监督学习的开源软件缺陷报告摘要生成的工作框架,并介绍了开源软件缺陷报告摘要领域常用数据集、预处理技术和摘要评估指标。其次,本文以无监督学习为切入点,分类阐述和归纳了无监督开源软件缺陷报告摘要方法,将无监督开源软件缺陷报告摘要方法分类为:基于特征评分方法、基于深度学习方法、基于图方法和基于启发式方法,并对每类方法进行讨论与分析。再次,从缺陷报告摘要的实用性出发,对现有的缺陷报告可视化摘要研究成果进行总结,并对固定缺陷报告摘要和可视化缺陷报告摘要的实用性做出分析。最后,对现有研究成果及综述进行讨论和分析,指出了开源软件缺陷报告摘要领域在缺陷报告数据集、抽取式摘要和黄金标准摘要三个方面面临的挑战和对未来研究的展望。
-
-
徐润华;
王东波;
刘欢;
梁媛;
陈康
-
-
摘要:
能降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究很少。文章面向《资治通鉴》语料,基于SikuBERT预训练模型进行自动摘要实验,并对比其与传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现。实验结果表明:基于SikuBERT预训练模型生成的摘要结果在稳定性、覆盖度等方面较好;通过专家人工打分方式,基于SikuBERT预训练模型生成的摘要结果平均得分最高。实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用SikuBERT预训练模型对古文进行信息处理的适用性。
-
-
陈红
-
-
摘要:
由于文本中事件之间的时序关系可以帮助人们更好地理解文本内容,故针对新闻报道类文本,将事件作为其基本语义单元,并根据时序关系建立事件有向网络文本表示模型;利用Pag-eRank算法结合主题相关度对时序网络进行节点重要度计算及调整;最后,按照重要度以及事件发生的顺序进行排序,并按照一定的压缩比提取摘要句,删除冗余的句子,将事件对应的原语句作为摘要.实验结果表明,基于事件时序关系的自动摘要方法效果较好.
-
-
祁荣苓;
焦文彬;
汪洋
-
-
摘要:
【目的】随着“互联网+电子政务”的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策。本文旨在研究一种适合电子政务文档的自动摘要算法。【方法】本文针对电子政务资讯文本的特点提出了一种融合Doc2Vec句子向量表示方法和模糊均值聚类方法的算法并应用在电子政务资讯文档的自动摘要生成中,不仅考虑句子之间的相关度,而且针对文章的特点对于每个句子赋予一定的权重来表示他作为摘要句子的重要性。【结果】实验表明,相较于目前常用的k-means算法结果和复杂的深度学习算法结果,该算法在电子政务资讯文档的自动生成取得了比较好的结果。【结论】研究自动摘要技术并在电子政务领域应用是一项很有价值的工作。
-
-
祁荣苓;
焦文彬;
汪洋
-
-
摘要:
[目的]随着"互联网+电子政务"的发展,国家越来越重视我国电子信息化建设,对于政府相关决策者、管理者、信息化工作者及研究人员来说,迫切需要一种方式可以快速有效地获取众多的电子政务资讯来指导信息化评估和决策.本文旨在研究一种适合电子政务文档的自动摘要算法.[方法]本文针对电子政务资讯文本的特点提出了一种融合Doc2Vec句子向量表示方法和模糊均值聚类方法的算法并应用在电子政务资讯文档的自动摘要生成中,不仅考虑句子之间的相关度,而且针对文章的特点对于每个句子赋予一定的权重来表示他作为摘要句子的重要性.[结果]实验表明,相较于目前常用的k-means算法结果和复杂的深度学习算法结果,该算法在电子政务资讯文档的自动生成取得了比较好的结果.[结论]研究自动摘要技术并在电子政务领域应用是一项很有价值的工作.
-
-
王义真;
欧石燕;
陈金菊
-
-
摘要:
[目的]针对民事一审裁判文书内容进行文本自动摘要,为裁判文书的用户提供简练可读、连贯通顺和准确高效的摘要文本.[方法]提出一种面向裁判文书自动摘要的新方法,该方法由抽取式摘要和生成式摘要两个阶段构成.在第一阶段抽取式摘要中,在预训练模型的基础上加入膨胀残差门控卷积神经网络进行裁判文书关键句子抽取得到抽取式文摘;在第二阶段生成式摘要中,将抽取式文摘作为模型的输入,通过序列到序列模型生成最终的裁判文书摘要.[结果]本文所提模型在裁判文书自动摘要实验中的ROUGE指标分别是50.31、36.60、48.86,较基准模型LEAD-3分别提高25.00、23.25、24.66.[局限]将第一阶段得到的抽取式摘要作为第二阶段生成式模型的输入,存在模型的累计误差,模型的整体效果受到第一阶段抽取式模型的影响.[结论]本文模型可以有效地应用在裁判文书自动摘要服务中,解决裁判文书信息过载问题,为裁判文书用户提供了一种快速阅读裁判文书、获取知识的新途径.
-
-
王义真;
欧石燕;
陈金菊
-
-
摘要:
【目的】针对民事一审裁判文书内容进行文本自动摘要,为裁判文书的用户提供简练可读、连贯通顺和准确高效的摘要文本。【方法】提出一种面向裁判文书自动摘要的新方法,该方法由抽取式摘要和生成式摘要两个阶段构成。在第一阶段抽取式摘要中,在预训练模型的基础上加入膨胀残差门控卷积神经网络进行裁判文书关键句子抽取得到抽取式文摘;在第二阶段生成式摘要中,将抽取式文摘作为模型的输入,通过序列到序列模型生成最终的裁判文书摘要。【结果】本文所提模型在裁判文书自动摘要实验中的ROUGE指标分别是50.31、36.60、48.86,较基准模型LEAD-3分别提高25.00、23.25、24.66。【局限】将第一阶段得到的抽取式摘要作为第二阶段生成式模型的输入,存在模型的累计误差,模型的整体效果受到第一阶段抽取式模型的影响。【结论】本文模型可以有效地应用在裁判文书自动摘要服务中,解决裁判文书信息过载问题,为裁判文书用户提供了一种快速阅读裁判文书、获取知识的新途径。
-
-
费宗翔;
田鹏
-
-
摘要:
上海市教育委员会教学研究室在多年的课程与教学调研工作中积累了大量的调研报告,这些报告大多是文档格式,数量多、语义描述方式多样、内容表征意义模糊,如何快速、直观地把握文本的语义是一个难题.自然语言处理技术经过多年的发展,在自动摘要、信息抽取等方面发挥了重要的作用.介绍了自然语言处理技术在课程与教学调研报告语义分析中的应用,阐述了在分词库扩充、文章主题词抽取、自动摘要提取等方面的实践研究.
-
-
周蔚;
王兆毓;
魏斌
-
-
摘要:
当前面向中文内容的自动摘要模型应用于法律裁判文书时,主要采用抽取式方法进行摘要.但由于法律文本比较冗长、结构化程度较低,抽取式摘要的精准度和可靠性有所欠缺.为了获得法律裁判文书的高质量文本摘要,文中提出了一种生成式多模型融合的自动摘要方法.在Seq2Seq模型的基础上,引入注意力(attention)机制,同时通过Bert预训练和强化学习等方法,结合选择门技术,提出了BASR(Bert Based Attention Seq2Seq Reinforced Model)模型.将50000篇法律裁判文书作为语料,以小额诉讼和简易程序类型的裁判文书为代表性研究对象,实验结果证明新模型有较好的效果,在ROUGE评价中相比传统的Seq2Seq+Attention模型取得了均值5.81%的性能提升.
-
-
-
-
-
-
-
杨睿涵;
续子恺
- 《中国新闻技术工作者联合会2020年学术年会》
| 2020年
-
摘要:
解放日报社经过几十年的发展,积累了大量的历史图片,但这些图片资源由于缺少分类、关键字以及标签信息而不能得到充分地利用,造成了资源的浪费.自然语言处理技术经过多年的发展,在文本分类、自动摘要、信息抽取等方面发挥了重要的作用.本文介绍了自然语言处理技术在解放日报智能视觉创作系统中的应用情况,分析了自然语言处理技术在文章自动分类、实体及关键词抽取、文章自动摘要等方面的技术特点.
-
-
-
ChiChung Tao;
陶治中;
RueiJhih Jian;
簡睿志;
TingKai Chen;
陳亭愷;
LiMing Chien;
錢力銘
- 《第十三届海峡两岸智能运输系统学术研讨会》
| 2013年
-
摘要:
当今社会已成为信息化时代,现代人对于因特网倚赖甚深,诸多意见皆以网络文章存在于网络中,亦称舆情。随着民众意见发声平台逐渐转移至网络上,网络舆情在民众意见的代表性上越发具有意义,然而因特网的普及亦造成舆情泛滥的现象,为使舆情能够清析并具备可阅读性,故提出以云端平台为基础所建置决策支持系统之自动摘要的方法,利用算法缩略舆情文本内容,产生具有意义的缩略性文章,以使管理人或决策者可藉由摘要内容有效率的了解舆情内容。为解决现今常见的民众意见问题,以提出支持决策支持系统的网络文章自动摘要方法为主,针对网络舆情进行网络文章的收集,并以算法缩减文章内容,使管理人可快速并且把握舆情重点,以作为决策支持系统建置的解决方法。
-
-
-
罗威
- 《第十六届全国计算机信息管理学术研讨会》
| 2002年
-
摘要:
在知识管理系统中实现文本挖掘,可帮助知识用户发现并不确切知道自己已有的信息.本文介绍了在知识管理系统中实现文本挖掘的问题.作者首先对目前知识管理的产品进行分类,然后阐述了在知识管理系统中实现文本挖掘的必要性,最后列出了目前主要的文本挖掘技术及其常见实现.
-
-
-
-
-
-
-
-
- 华东理工大学
- 公开公告日期:2022-09-09
-
摘要:
本发明公开了基于深度学习的子句级自动摘要模型系统及摘要生成方法,本模型系统在使用时,首先利用句级抽取单元将原始数据进行字句拆分,构建输入字句;利用基于BERT预训练模型和Transformer模型的编码器对经句级抽取单元构建的输入字句进行处理,获得包含上下文语义信息的子句的向量表示C″i,j;利用分类器对向量表示进行初步筛选,并输出初步候选子句摘要;最后通过基于BERTScore的摘要匹配器,计算候选子句摘要和原文的语义相似度,得到与原文语义最匹配的摘要;本模型通过以子句作为抽取单元,能够同时平衡摘要信息的重要性和完整性,有效的解决了字句提取过程中的冗余问题,具有摘要信息的完整性高、提取速度快的特点。
-
-
-