基于引文的英文文档文摘自动生成方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

对于一名科研工作者而言，快速进入一个新的研究领域是痛苦的，因为这需要阅读大量相关的已有文献。一个快速高效的办法是阅读该领域的文献综述，从这类文章中可以快速了解该领域的历史背景、研究现状和未来趋势。但优秀的文献综述数量较少，并非在各个领域各个方向都能找到，其原因是一篇优秀的文献综述一定是出自该领域的一位资深研究者之笔，并且费时费力。所以近年来，越来越多的学者开始研究自动文献综述系统，只需要用户输入其感兴趣的研究领域，系统便能生成一篇该领域的文献综述。作为这项研究的重要内容之一，如何为单篇文章自动生成摘要自然也得到了学术界的高度重视。有研究表明，在引用同一篇文章时，不同的作者往往会关注不同的方面，因此，对一篇文章的引文集合进行合理分析，就可以知道这篇文章做了什么工作，有哪些贡献，以及对其研究领域产生了怎样的影响。本文首先了介绍了一种已有的使用引文进行自动文摘的方法，通过对该方法进行分析，针对其存在的一些缺点和不足，提出了一种改进的方法，改进主要体现在：
　　1.在生成的摘要中加入比较信息。在原方法生成的摘要中，仅包含贡献信息，即描述目标文献所做工作或所取得成果的信息，但忽略了施引文献中蕴含的比较信息，即描述自己工作和已有工作之间有意义的不同之处的信息，通过收集并分析比较信息，便可以把握一个研究领域的发展脉络，对文献综述自动生成意义重大，因此，在本文提出的方法中，将比较信息加入到了生成的摘要中。
　　2.使生成的摘要包含更多更重要的贡献信息。在原方法生成的摘要中，包含贡献信息的多少及包含贡献信息的重要程度直接取决于聚类是否精确。本文使用与原文不同的聚类方法，提高了聚类的精确度，从而使生成的摘要包含更多更重要的贡献信息。
　　3.使用更加准确的引文权重计算方法。原方法中，在得到聚类结果后，需要从每个类中抽取最具代表性的引文来组成摘要，因此需要计算引文的权重，原文在计算权重时只考虑了引文之间的文本相似性，在此基础上，本文还综合考虑了施引文献的被引数和施引文献通讯作者的影响因子，从而使权重的计算更加全面。
　　4.使用更加合理的评价方法。原方法在对实验结果进行评价时，根据实验结果来制定评价标准，评价结果难免有失公允，本文使用了更加客观合理的评价方法。

著录项

作者
任潇雨;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机科学与技术
授予学位硕士
导师姓名郑有才;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
英文文摘; 自动生成; 引文权重计算; 聚类方法;

相似文献

中文文献
外文文献
专利

1. 基于关键词检索技术的PowerPoint文档自动生成方法研究 [J] . 唐小石 ,梁洪利 . 中国信息技术教育 . 2014,第015期
2. 飞行数据曲线文档自动生成方法研究 [J] . 蔡伟健 ,汪洋 . 科技视界 . 2019,第010期
3. 一种文本分割技术的多文档文摘方法研究 [J] . 王萌 ,唐新来 ,何婷婷 . 计算机应用与软件 . 2014,第009期
4. 多文档文摘中句子优化选择方法研究 [J] . 秦兵 ,刘挺 ,陈尚林 . 计算机研究与发展 . 2006,第006期
5. 基于VBA和DocVariable域实现合同文档的自动生成 [J] . 刘铁生 . 现代计算机（专业版） . 2021,第006期
6. 从医学英文摘要初审看目前英文摘要写作所存在的问题 [C] . 潘越 ,朱丹 ,董月 . 第十三届（2015）全国核心期刊与期刊国际化、网络化研讨会 . 2015
7. 基于主题模型的中英文多文档自动文摘 [A] . 张明慧 . 2011

基于引文的英文文档文摘自动生成方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅