声明
致谢
摘要
第一章 绪论
1.1 研究背景及意义
1.2 微博主题挖掘技术的研究现状
1.2.1 国内研究现状
1.2.2 国外研究现状
1.3 存在的问题及本文研究内容
第二章 微博主题特征及微博数据的获取和预处理
2.1 引言
2.2 微博主题特征
2.3 微博数据的获取
2.3.1 新浪微博开放平台API
2.3.2 利用网络爬虫获取微博信息
2.4 微博话题检测
2.4.1 预处理
2.4.2 主题词检测
2.4.3 主题词聚类
2.5 本章小节
第三章 文本主题挖掘技术
3.1 文本挖掘的任务
3.2 文本表示
3.2.1 权值计算
3.2.2 概念模型
3.3 文本分类的几种机器学习方法
3.3.1 概率分类器
3.3.2 贝叶斯回归分析
3.3.3 决策树分类器
3.3.4 神经网络分类器
3.3.5 支持向量机
3.3.6 Boosting分类器
3.4 LDA模型
3.4.1 Gibbs抽样
3.4.2 LDA模型简介
3.4.3 Labeled-LDA模型
3.5 动态文本主题挖掘
3.5.1 文本会话的抽取
3.5.2 动态文本会话抽取预处理
3.5.3 动态短文本聚类算法
3.6 本章小结
第四章 动态Labeled-LDA建模实验
4.1 基于动态Labeled-LDA模型的微博主题挖掘建模
4.2 实验设计与结果分析
4.2.1 实验环境
4.2.2 实验数据
4.2.3 实验设置
4.3 本章小结
第五章 总结和展望
5.1 本文总结
5.2 工作展望
参考文献
攻读硕士学位期间的学术活动及成果情况
合肥工业大学;