声明
摘要
第一章 绪论
1.1 论文选题背景
1.2 国内外研究现状
1.3 本文研究内容
1.4 本文组织结构
第二章 热点发现相关基础知识
2.1 基础知识
2.1.1 文本表示模型
2.1.2 特征选择
2.1.3 特征权重
2.2 分类算法
2.2.1 分类算法简介
2.2.2 支持向量机
2.3 聚类算法
2.3.1 聚类算法简介
2.3.2 Kmeans聚类算法
2.3.3 评估指标
2.4 主题模型
2.4.1 主题模型发展史
2.4.2 LDA主题模型
2.5 小结
第三章 基于主题特征扩展的聚类研究
3.1 引言
3.2 基于主题特征扩展的聚类研究
3.2.1 短文本聚类
3.2.2 基本思想
3.2.2 基于主题特征扩展的聚类流程
3.3 实验与分析
3.3.1 数据集
3.3.2 实验设计
3.3.3 实验结果与分析
3.4 小结
第四章 基于聚类和支持向量机相结合的热点发现
4.1 引言
4.2 基于聚类与支持向量机相结合的热点发现
4.2.1 基本思想
4.2.2 基本流程
4.2.3 热点发现相关算法
4.3 实验与分析
4.3.1 实验数据
4.3.2 热点发现评价方法
4.3.3 实验结果与分析
4.4 小结
第五章 基于LDA扩展的短文本热点发现方案
5.1 流程设计
5.2 算法中各模块的设计与实现
5.2.1 预处理
5.2.2 特征提取
5.2.3 特征选择与特征集
5.2.4 LDA模块
5.2.5 特征选择与特征权重
5.2.6 Kmeans聚类
5.2.7 SVM分类
5.3 实验测试
5.3.1 实验语料
5.3.2 模型测试
5.4 小结
第六章 总结及未来的工作
6.1 总结
6.2 未来的工作
致谢
攻硕期间从事的科研工作及取得的研究成果
参考文献
重庆邮电大学;