在线网络中文本自动摘要系统研究和实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的快速发展，人们已经越来越多的依靠互联网获取信息和资源，网络成为了人们生活中不可缺少的知识宝库。然而，由于网络中的资源太过丰富和庞大，为了使网络用户能够快速的找到对自己有用的信息，文本自动摘要技术应运而生。文本自动摘要技术利用计算机自动提取和生成文章的主题句，使用户能在最短的时间内掌握文章的主题思想，大大的减少了用户查找信息所用的时间，具有广泛的应用价值。
　　近年来，文本自动摘要技术受到国内外学者们纷纷的的重视和研究，并且学者们也提出了很多优秀算法。本文结合数据挖掘、机器学习以及人工智能技术对文本自动摘要技术进行了深入研究，主要研究内容和工作如下：
　　1）先前研究人员提出基于优化方法对文本进行自动摘要的研究，其思路主要是通过优化算法优化句子的特征属性权值，再根据权值计算每个句子的特征加权和。本文提出基于最优化问题的文本自动摘要算法，与前人的思路不同，主要体现在本文主要通过优化两个组合问题：摘要的特征权值和句子组合优化，算法的核心思想是：首先以摘要为单位，总结摘要的特征属性；接着利用遗传优化算法得到每个摘要特征属性的权值；最后再利用粒子群优化算法找出最优的句子组合即摘要。实验结果表明本文所提的算法在压缩率为20％和30%情况下，准确率、召回率和F-值分别达到0.4849、0.4843、0.4894和0.5998、0.8556、0.7052，可接受度分别达到0.75和0.8，其实验结果明显优于其他相关算法。
　　2）本文从复杂网络的角度对文章句法特点进行分析与研究，发现句子与句子之间的复杂的关联度可以看作复杂网络的属性。与先前其他学者的研究思路不同，本文提出采用复杂网络的社团划分思想对文章进行主题划分，并给出五种不同的提取摘要的方法进行摘要的提取。在实验过程中，通过与先前学者的相关研究结果进行比较与分析，本文提出的算法在实验效果上更胜一筹，在压缩率为20%和30%的情况下，准确率、召回率和F-值分别达到0.5032、0.5365、0.5193和0.6503、0.8209、0.7257，可接受度分别达到0.8和0.85，在与其他相关算法比较来看，该算法在召回率上更有明显优势，这说明该算法提取的摘要更加全面的符合文章的主题。
　　3）最后本文根据作者研究成果，开发了自动回帖系统，其中自动摘要技术是自动回帖系统中的核心技术，自动摘要的准确率越高，自动回帖系统越智能越有价值。

著录项

作者
杨瑞;
展开▼
作者单位

南京航空航天大学;

展开▼
授予单位南京航空航天大学;
学科计算机科学与技术
授予学位硕士
导师姓名夏正友;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
在线网络; 文本自动摘要; 中文分词; 优化算法; 复杂网络; 社团划分;

相似文献

中文文献
外文文献
专利

1. 简单中文自动摘要系统研究 [J] . 张雷生 ,万绍俊 ,许鹏文 . 装备学院学报 . 2004,第003期
2. 多知识源融合的自动摘要系统研究与实现 [J] . 陈燕敏 ,王晓龙 ,刘秉权 . 高技术通讯 . 2006,第004期
3. 基于自动摘要的网络情报收集系统研究 [J] . 李念峰 . 现代情报 . 2007,第011期
4. 基于物联网的水质在线自动监测系统研究与实现 [J] . 李随群 ,蔡郡倬 ,高祥 . 四川理工学院学报（自然科学版） . 2018,第004期
5. 网络课程在线答疑系统研究与实现 [J] . 姬亚利 ,王基生 ,张忠山 . 软件导刊 . 2014,第001期
6. 基于词典的在线新闻自动文本摘要系统的研究与实现 [C] . 官礼和 ,李永礼 . 2003年全国理论计算机科学学术年会 . 2003
7. 基于摘要信息的中文信息检索可视化系统研究与实现 [A] . 陈颖 . 2007

在线网络中文本自动摘要系统研究和实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅