声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.2.1 LDA的研究现状
1.2.2 HMM的研究现状
1.2.3 主题演化研究现状
1.3 本文主要研究内容
1.3.1 主要研究内容
1.3.2 论文的特色
1.4 论文的结构安排
第二章 主题模型的基本原理
2.1 文本挖掘及相关理论基础
2.1.1 文本挖掘的概念
2.1.2 文本挖掘的过程
2.1.3 文本的特征化表示
2.1.4 文本挖掘相关模型
2.1.5 关联规则
2.1.6 层次聚类
2.1.7 K-Means聚类
2.2 概率主题模型简介
2.2.1 TF-IDF模型
2.2.2 一元混合模型
2.2.3 LSI模型
2.2.4 PLSI模型
2.3 共现理论
2.3.1 词的共现现象
2.3.2 基于共现词对文档建模
2.4 本章小结
第三章 ATNLDA主题模型介绍
3.1 LDA模型
3.1.1 模型描述
3.1.2 抽取算法
3.1.3 LDA概率主题模型的文本生成过程
3.2 基于共现词对的文档向量模型的特点
3.3 ATNLDA主题模型
3.4 本章小结
第四章 ATNLDA主题模型验证
4.1 实验分析
4.2 实验数据获取
4.3 实验数据预处理
4.4 LDA中α和β参数的确定方法
4.5 ATNLDA过程
4.6 ATNLDA主题分析
4.7 ATNLDA主题关联关系分析
4.8 本章小结
第五章 主题演化理论
5.1 隐马尔可夫模型
5.1.1 HMM的基本理论
5.1.2 HMM的三个主要问题
5.1.3 HMM的主要算法
5.2 主题演化基本理论介绍
5.2.1 主题演化定义
5.2.2 主题演化的模式
5.2.3 主题强度度量
5.2.4 主题相似性度量
5.3 主题演化模型介绍
5.4 本章小结
第六章 主题演化及分析
6.1 数据准备
6.2 主题演化实验
6.2.1 实验步骤
6.2.2 实验参数的获取
6.2.3 实验结果及分析
6.3 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
攻读硕士学位期间的研究成果
致谢