声明
摘要
第一章 绪论
1.1 研究背景
1.1.1 微博的发展
1.1.2 研究目的和意义
1.2 国内外研究现状
1.2.1 社交网络研究
1.2.2 微博情感分析
1.2.3 微博内容研究
1.3 论文主要工作
第二章 文本挖掘概述
2.1 文本表示
2.1.1 中文分词和停用词
2.1.2 词频和逆文档频率
2.1.3 向量空间模型
2.2 文本分类
2.2.1 分类的相关问题
2.2.2 常见分类算法
2.3 文本聚类
2.3.1 聚类的相关问题
2.3.2 扁平聚类算法
2.3.3 层次聚类
2.4 本章小结
第三章 LDA主题模型
3.1 隐性语义索引
3.1.1 隐性语义索引
3.1.2 概率隐性语义索引
3.1.3 一元混合模型
3.2 LDA主题模型
3.2.1 LDA主题模型简介
3.2.2 LDA数学基础
3.2.3 LDA主题模型
3.3 本章小结
第四章 微博主题分析和基于主题聚类的短文本分类
4.1 主题聚类
4.2 微博短文本分类
4.3 算法设计与实验分析
4.3.1 实验数据集和实验环境
4.3.2 词级特征选择:新词发现、分词、特征词选择
4.3.3 主题演化和新主题发现
4.3.4 短文本分类实验
4.4 本章小结
第五章 总结与展望
5.1 全文工作总结
5.2 未来工作展望
参考文献
致谢