声明
1 绪论
1.1研究背景和意义
1.2 国内外研究现状
1.2.1基于外部知识库的短文本分类方法
1.2.2基于隐含主题的短文本分类方法
1.3 课题研究目的与内容
1.4 论文组织方式
2 文本分类相关技术与理论
2.1文本表示与权重计算方法
2.2常用特征选择方法
2.2.1信息增益法
2.2.2卡方检验法
2.2.3互信息法
2.3 LDA主题模型
2.4 常用分类算法
2.4.1 支持向量机
2.4.2 K近邻分类算法
2.5文本分类评价标准
2.6本章小结
3 基于多粒度主题模型的特征扩展方法
3.1基于单粒度主题模型的特征扩展方法
3.2基于单粒度主题模型方法的不足
3.3基于多粒度主题模型的特征扩展框架
3.3.1 生成N个主题模型
3.3.2 构造多粒度主题模型特征空间
3.3.3 短文本特征扩展
3.4本章小结
4 基于多粒度主题模型的短文本分类算法
4.1数据获取和预处理
4.1.1 数据获取
4.1.2 数据预处理
4.1.3 特征词选择
4.2 LDA模型训练
4.3分类流程
4.3.1扩展特征向量的距离计算
4.4本章小结
5 实验和评估
5.1实验环境
5.2实验数据
5.3评价标准
5.4基础实验
5.4.1 参数β对分类结果的影响
5.4.2 系数μ对分类结果的影响
5.4.3参数H对分类结果的影响
5.5对比实验
5.6本章小结
6 总结与展望
6.1全文总结
6.2工作展望
致谢
参考文献
华中科技大学;