首页> 中文学位 >基于短语主题模型和多文档自动摘要技术文献综述内容推荐
【6h】

基于短语主题模型和多文档自动摘要技术文献综述内容推荐

代理获取

目录

声明

摘要

图目录

表目录

第1章 绪论

1.1 课题背景

1.2 信息检索

1.3 多文档自动摘要

1.4 本文的主要工作

1.5 本文的组织结构

1.6 本章小结

第2章 主题模型相关研究

2.1 主题模型的提出与发展

2.2 概率隐性语义分析模型

2.3 LDA模型

2.3.1 LDA模型表示

2.3.2 LDA参数估计

2.3.3 LDA模型的扩展

2.4 主题模型评价标准

2.4.1 Perplexity

2.5 本章小结

第3章 文档自动摘要相关研究

3.1 单文档自动摘要

3.2 多文档自动摘要

3.2.1 信息混合摘要

3.2.2 主题驱动的摘要和MMR

3.2.3 基于Centroid的摘要

3.2.4 基于句子压缩的多文档摘要

3.3 国内文档自动摘要的研究

3.4 文档自动摘要的评价标准

3.4.1 文档摘要自动评价方法

3.5 本章小结

第4章 平滑的PhraseLDA主题建模

4.1 短语主题模型PhraseLDA

4.1.1 频率短语挖掘

4.1.2 基于短语袋假设的PhraseLDA主题建模

4.1.3 PhraseLDA的缺点

4.2 平滑的参数估计的短语主题模型SmoothPhraseLDA

4.3 实验结果

4.3.1 Perplexity

4.3.2 Perplexity+

4.3.3 主题结果质量评估

4.4 本章小结

第5章 基于短语主题建模的多文档自动摘要

5.1 SumBasic文档自动摘要生成算法

5.2 基于主题的文档自动摘要技术

5.3 综合SmoothPhraseLDA与SumBasic的综述内容推荐

5.3.1 基于SmoothPhraseLDA的主题权重计算

5.3.2 基于SumBasic算法的综述内容推荐

5.3.3 适用于应用的综述内容推荐算法

5.4 语句压缩和精简

5.5 实验结果

5.6 本章小结

第6章 文献综述系统的实现

6.1 文献检索

6.1.1 文献数据采集系统的设计

6.2 文献检索服务

6.2.1 关键词检索

6.3 检索结果可视化服务

6.4 人机协同综述系统

6.5 本章小结

第7章 总结与展望

7.1 总结

7.2 展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

互联网信息资源的快速增长对信息检索领域的研究和应用提出了极大的挑战。信息检索,特别是对检索结果的处理工作越来越受到学者们的重视。如何帮助用户更快地、更有效地进行信息获取是一个值得研究和深入的话题。学术文献是一种相比其他如新闻文章,博客,网页等包含信息更加标准和丰富的资源。对从网络上得到的大量学术文献中进行快速有效的信息获取,对学者们而言是具有重大的价值和意义的。
  本文搭建的文献综述系统旨在为用户提供一个方便的文献资源利用平台,中英文文献资源检索、文献检索结果可视化分析和人机协同综述撰写等服务。其中文献资源检索是利用开源工具Lucene对从网络文献数据库下载的文献数据创建索引从而提供检索支持。而检索结果可视化分析是对检索结果的文献列表的元数据分析和统计,通过可视化展示为用户提供一个文献随时间、地域、热点等因素的如何变化的视角。
  在人机协同综述撰写中,通过提供综述参考目录和参考内容来辅助用户综述的撰写。综述参考目录是利用对检索结果聚类的工具carrot2提供简单的综述参考目录。综述参考内容是本文介绍的重点部分,主要是通过短语主题建模来实现文献文档中与用户提供的主题相关的参考内容推荐服务。本文在短语主题模型PhraseLDA的基础上进行改进,使用SmoothPhraseLDA计算文档中句子的主题权重,并在SumBsic多文档自动摘要算法基础上完成了文献综述参考内容推荐的功能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号