中文科技文献自动摘要系统

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Internet的快速发展，人们迫切需要信息压缩工具来对大量的信息进行提炼、浓缩，而自动摘要系统正是这样的工具。人们可以首先利用计算机对这些大量的文本信息进行处理，生成基本能够反映对应文章的主题的摘要信息。然后人们只要阅读少量的摘要就能确定是否进行进一步阅览全文，这将大大提高人们获取电子文本信息的效率。本文正是对中文自动摘要系统研究的一个探索。本文首先介绍了摘要提取的定义、意义、摘要的分类以及摘要的书写规范，提出了本课题的研究背景和目标。接着本文通过对现阶段几种主要的自动摘要技术：基于统计的自动摘要方法、基于自然语言理解的文摘方法、信息抽取、基于结构的自动摘要方法的比较和分析，得到它们自身的优点和缺点，并在此基础上提出一种主要基于传统的统计技术，并结合一定的语义关系的摘要方法。该方法主要结合了基于统计和理解的摘要技术，针对中文科技文献提取出摘要。该方法首先对文本进行分词和词形标注处理，然后通过对词频等文本物理信息的统计，利用HowNet中的语义关系计算词语间的相似度，以此合并具有同义关系的词语，结合停用词词库和科技领域词词库计算出词语的权重，按照词语权重提取出能表征文本主要内容的特征词；根据句子的物理信息以及句子中包含的特征词情况计算出句子的权重，按照句子权重大小提出候选摘要句；最后利用VSM消除重复候选摘要句，并采取措施加强摘要连贯性、消减指代，参照科技文献摘要写作规范将候选摘要句按原文顺序输出。最后本文还讨论了系统的评价方法和系统的实验结果。实验结果达到了预期效果，验证了本文提出的基于统计摘要与基于理解摘要相结合的摘要方法的可行性。本系统提出的摘要质量较好。另外，在实现系统的过程中，本文还提出了领域词词库自动学习的方法。该方法能使领域词词库随着处理文摘数量的增加自身得到不断的完备，提高系统提取出的摘要的质量。

著录项

作者
李立燕;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名杨国纬;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理 ;
关键词
中文科技文献; 摘要提取; 特征词; 语义关系; HowNet; VSM;

相似文献

中文文献
外文文献
专利

1. OA中文文献自动摘要系统 [J] . 王永成 . 情报学报 . 1997 ,第002期
2. 中文科技文献自动文献系统的研究 [J] . 黄河笑 ,郭俊文 . 现代情报 . 1996 ,第003期
3. 中文科技文献题内自动抽词标引系统 [J] . 邵艳秋 ,刘挺 ,王开铸 . 智能计算机与应用 . 1998 ,第002期
4. 中文科技文献自动文摘系统的研究 [J] . 郭俊文 . 情报探索 . 1995 ,第004期
5. 中文科技文献计算机自动标引系统的研究 [J] . 牛凯 . 情报学报 . 1995 ,第001期
6. OA中文文献自动摘要系统的开发 [C] . 王永成 . 第十二届全国计算机情报管理学术讨论会 . 1996
7. 基于TextRank算法的中文文献自动摘要提取研究 [A] . 赵君 . 2019

中文科技文献自动摘要系统

目录

摘要

著录项

相似文献

相关主题

期刊订阅