文摘
英文文摘
声明
第一章前言
1.1课题的背景与意义
1.2国内外研究现状
1.3课题研究目标及研究内容
1.4论文组织结构
第二章多文档自动文摘及相关技术介绍
2.1主题划分技术
2.2、文本聚类技术
2.2.1文章单元聚类技术
2.2.2聚类文档的聚类技术
2.2.3常用的文本聚类算法
2.3、多文档主题分析
2.3.1多文档主题形成分析
2.3.2主题分析对于自动文摘结果改善的讨论
2.4本章小结
第三章自动确定阈值的文章主题段落划分
3.1基于阈值自动发现的主题划分
3.2段落的主题相似度以及阈值自动发现
3.2.1段落的主题相似度
3.2.2相似度阈值的自动发现
3.3语义段落边界的发现
3.4试验设计与结果
3.5本章小结
第四章K-means文档聚类中心点选择方法改进
4.1文本聚类研究分析
4.2基于子图划分的中心点选择
4.3聚类实现过程
4.3.1聚类前期处理工作
4.3.2算法处理
4.3.3算法时间复杂度分析
4.4实验结果
4.4.1数据集的选择和评价标准
4.4.2结果评价和分析
4.5本章小结
第五章多文档自动文摘的主题分析
5.1多文档的主题分析
5.1.1基于词频重要性的语义段落排序
5.1.2基于语义段落相关度的段落排序
5.1.3基于语义段落聚类的语义段落排序
5.2 Manifold跟聚类结合的主题形成方法
5.2.1算法思想介绍
5.2.2算法过程描述
5.2.3主题描述向量的建立
5.2.4语义段落抽取方法
5.2.5算法的实现
5.3评测方法及实验结果
5.3.1两种主题划分方法的划分结果
5.3.2压缩比一定时的文摘的评测结果
5.3.3压缩比不同时的试验结果
5.3.4主题划分方法对多文档文摘的影响
5.4本章小结
第六章文摘生成与评价
6.1文摘句子的抽取
6.1.1多文档自动文摘句子抽取
6.1.2多文档文摘句子的排序方式
6.2文摘句子的优化
6.3本文的实验结果
6.3.1基于句子聚类的多文档文摘
6.3.2基于主题分析的多自动文摘
6.4本章小结
结论
参考文献
攻读硕士学位期间取得的学术成果
致谢
中国石油大学(华东);