摘录式单文档中文自动文摘系统的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在当今信息爆炸的时代,人们面对着大量没有经过整理的原始数据时,将会茫然不知所措,而自动文摘技术能给人们提供更有力的信息加工技术和工具,但时下出现的自动文摘系统,特别是中文自动文摘系统并没有取得很好的效果,故本论文对中文自动文摘系统进行了研究。本论文提出的摘录式单文档中文自动文摘系统以单篇纯文本文档作为输入,自动地抽取全面准确地反映文档中心内容的句子组成文档的摘要。本系统首先采用分词工具ICTCLAS对文档进行分词和词性标注:然后采用TFC权值对分词后的文档建立向量空间模型,抽取句子的特征;接着采用朴素贝叶斯分类算法自动学习特征组合的方式和参数,将摘要转化成分类问题;最后根据分类结果,抽取文摘句组成文档的摘要。本论文首先对自动文摘技术进行综述:其次,介绍摘录式单文档中文自动文摘系统的总体设计,包括中文分词、文本分析、文本转换及文本合成四大模块的设计;再次,介绍摘录式单文档中文自动文摘系统的实现;最后,介绍系统性能评估的各个参数指标,并使用weka及30篇不同体裁的文档对系统的性能进行评估。本论文提出的摘录式单文档中文自动文摘系统分为四大模块,每个模块通过比较分析当前的文摘技术,选取一种最优的方案,试图通过各个模块的局部最优,最终获得系统的最优文摘效果。通过用Weka及30篇不同体裁的文档对系统的性能进行测试,表明本系统的文摘抽取效果是较好的。

著录项

作者
曾红伟;
展开▼
作者单位

华东师范大学;

展开▼
授予单位华东师范大学;
学科计算机应用技术
授予学位硕士
导师姓名江红;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
摘录式单文档; 中文自动文摘系统; 向量空间模型; 功能模块;

相似文献

中文文献
外文文献
专利

1. 基于自动文摘的地震灾情信息分析处理系统研究与实现 [J] . 高东辉1 ,路伟1 ,张永刚1 . 化工中间体 . 2015,第012期
2. 基于文本聚类的自动文摘系统的研究与实现 [J] . 郭庆琳 ,樊孝忠 ,柳长安 . 计算机工程 . 2006,第004期
3. 基于文本理解的自动文摘系统研究与实现 [J] . 杨晓兰 ,钟义信 . 电子学报 . 1998,第7期
4. 基于全信息词典的自动文摘系统研究与实现 [J] . 杨晓兰 . 情报学报 . 1997,第006期
5. 文本理解,知识获取及自动文摘系统研究与实现 [J] . 杨晓兰 ,王明会 . 电子器件 . 1997,第001期
6. 中文自动文摘系统研究 [C] . 李立燕 ,杨国纬 . 第二届全国信息检索与内容安全学术会议 . 2005
7. 中文单文档自动文摘的研究与实现 [A] . 何逸费 . 2018

摘录式单文档中文自动文摘系统的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅