首页> 中文学位 >基于主题模型的主题演化分析及预测
【6h】

基于主题模型的主题演化分析及预测

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究和进展

1.3 论文主要研究内容

1.4 论文章节安排

第二章 相关背景知识介绍

2.1 向量空间模型

2.2 概率主题模型

2.3 潜在狄利克雷分配模型

2.4 本章小结

第三章 基于LDA模型的文本主题演化

3.1 主题演化

3.2 基于LDA模型的文本主题演化

3.3 实验

3.4 本章小结

第四章 结合马尔科夫链的文本主题演化预测

4.1 基础知识

4.2 基于LDA的科技文献演化研究

4.3 实验结果与讨论

4.4 本章小结

第五章 基于非参贝叶斯方法的主题演化预测

5.1 基础知识

5.2 基于层次狄利克雷过程的文本主题演化

5.3 实验

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

附录1 攻读硕士学位期间撰写的论文

致谢

展开▼

摘要

随着互联网的不断发展,社交媒体得到了急速发展。如何利用用户在社交网络中产生的海量数据,来对其进行演化分析,成为了自然语言处理领域的研究热点。在社交媒体中,传统的主题检测方法其准确性和效率难以保证,为此主题模型的方法被提出。主题模型认为主题是由一组语义相关的词及词的概率分布表示,其具有可以很好的模拟大规模语料的语义信息的特性,因而得到广泛的应用。
  本文在已有的主题获取与演化技术的基础上做出了以下有意义的创新。首先,提出了一种基于潜在狄利克雷分配模型的主题演化方法。该方法在已有的演化方法的基础上,增加了主题过滤的方法,并在主题内容演化方面提出了一种判断主题演化状态的方法;其次,在主题演化方法的基础上,结合马尔科夫链模型,提出了一种可以预测主题演化趋势的方法;最后,尝试使用层次狄利克雷过程方法来代替潜在狄利克雷分配模型,以实现主题演化过程中主题数目的自动确认。
  在NIPS论文集上的实验表明,本文提出的演化可以准确获得主题在内容和强度上的演化趋势,结合马尔科夫链的预测方法可以有效预测其在未来几个时间窗口的演化趋势,使用层次狄利克雷的方法对主题演化进行分析及预测的效果优于使用潜在狄利克雷分配模型的方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号