首页> 中文期刊> 《计算机与数字工程》 >基于网络短文本主题挖掘技术研究

基于网络短文本主题挖掘技术研究

         

摘要

由于短文本内容少,在语义特征上短文本要比长文本匮乏的多,传统的主题模型对于普通文档非常有效,然而严重的数据稀疏问题使得短文本主题建模困难.为了解决这一问题,提出了GBDP(Gravity Biterm Topic Model Hierarchical Dirichlet Process)模型,它是一种基于BTM(Biterm Topic Model)的Dirichlet过程,同时结合CRP(Chinese Restaurant Process)不仅考虑词汇之间相关性而且也考虑到了词对之间的联系,最后对实际数据进行了对比实验,结果表明GBDP在主题质量和困惑度方面效果显著.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号