首页> 中文学位 >基于图的主观性多文本自动摘要方法研究和实现
【6h】

基于图的主观性多文本自动摘要方法研究和实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 论文的研究背景

1.2 自动摘要的研究现状

1.3 现有文本摘要的不足

1.4 本文的主要工作

1.5本文组织结构

第二章 自动摘要系统框架

2.1摘要类型

2.2 系统工作流程

2.3 预处理

2.4内容表示

2.5相似度测量

2.6内容选择

2.7内容次序

2.8本文解决问题

2.9本章小结

第三章 基于图的方法自动生成摘要

3.1基于图的表示方法

3.2计算句子相似度的方法

3.3计算句子倾向性

3.4基于LexRank选择中心句

3.5基于GRASSHOPPER算法选择剩余摘要句

3.6 本章小结

第四章 实验结果和评估分析

4.1 实验系统架构

4.2 实验文本预处理

4.3 倾向性种子词库

4.4 实验结果评估和分析

4.5 本章小结

第五章 结论

5.1 本文主要工作

5.2 存在问题和下一步研究方向

参考文献

致谢

展开▼

摘要

随着互联网技术的快速发展,现在已经进入了大数据时代。在互联网上存在着许多相同主题内容的文本。这些文本中即含有相同的内容,也有各自不同的内容。人们希望可以花最少时间获取大量信息内容。
  本文主要研究基于图的主观性多文本自动摘要方法。目标是从多篇相同主题的主观性文本中自动抽取出多句句子,组成一篇文本摘要。一般摘要的内容主要是来自于客观性文本,不必考虑文本中的语义倾向性。本文研究如何有效和准确地从主观性多文本中选择句子以产生摘要。同时,希望生成摘要的内容要简明和全面。
  本文采用基于图的无监督学习和半监督学习的方法来判断主观性句子并生成摘要。基于图的句子分级方法的优点是可以在无需训练的情况下直接选择摘要句,这样做的结果将无由于人工干预而产生偏向性问题。半监督学习则可以用少量人工标注数据来准确判断句子的倾向性。
  本文对基于图的LexRank方法和GRASSHOPPER方法进行改进。通过实验对改进前后生成实验结果的比较,改进后结果有了明显的提高。这说明本文研究方法对生成主观性多文本的摘要是有效的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号