首页> 中文学位 >基于多粒度主题模型的短文本分类算法研究
【6h】

基于多粒度主题模型的短文本分类算法研究

代理获取

目录

声明

1 绪论

1.1研究背景和意义

1.2 国内外研究现状

1.2.1基于外部知识库的短文本分类方法

1.2.2基于隐含主题的短文本分类方法

1.3 课题研究目的与内容

1.4 论文组织方式

2 文本分类相关技术与理论

2.1文本表示与权重计算方法

2.2常用特征选择方法

2.2.1信息增益法

2.2.2卡方检验法

2.2.3互信息法

2.3 LDA主题模型

2.4 常用分类算法

2.4.1 支持向量机

2.4.2 K近邻分类算法

2.5文本分类评价标准

2.6本章小结

3 基于多粒度主题模型的特征扩展方法

3.1基于单粒度主题模型的特征扩展方法

3.2基于单粒度主题模型方法的不足

3.3基于多粒度主题模型的特征扩展框架

3.3.1 生成N个主题模型

3.3.2 构造多粒度主题模型特征空间

3.3.3 短文本特征扩展

3.4本章小结

4 基于多粒度主题模型的短文本分类算法

4.1数据获取和预处理

4.1.1 数据获取

4.1.2 数据预处理

4.1.3 特征词选择

4.2 LDA模型训练

4.3分类流程

4.3.1扩展特征向量的距离计算

4.4本章小结

5 实验和评估

5.1实验环境

5.2实验数据

5.3评价标准

5.4基础实验

5.4.1 参数β对分类结果的影响

5.4.2 系数μ对分类结果的影响

5.4.3参数H对分类结果的影响

5.5对比实验

5.6本章小结

6 总结与展望

6.1全文总结

6.2工作展望

致谢

参考文献

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号