首页> 中文期刊> 《桂林电子科技大学学报》 >一种适用于微博主题提取的SMLDA模型

一种适用于微博主题提取的SMLDA模型

         

摘要

Due to the short message,scattering format and content,incomplete description and data noise,the micro-blog topic can not be obtained efficiently.An improved SMLDA model based on LDA is proposed.The model mainly takes mi-cro-blog authors association,the specific topic tags,the relay document association and the background topic into considera-tion and adopts the Gibbs sampling algorithm to derive parameters.The experimental results on Sina micro-blog data set show that compared with LDA model,the SMLDA model is more effective.%针对微博文本简短、格式内容散乱、信息描述不完全、数据噪声大导致无法高效获取微博主题的问题,提出一种基于 LDA改进的 SMLDA模型。该模型综合考虑微博作者之间的关系、微博特定主题的标签以及微博文本之间转发关系和背景主题,采用 Gibbs抽样算法推导模型参数。在真实新浪微博数据集上进行试验分析,实验结果表明,SMLDA 模型与LDA模型比较,前者效率更高,提取结果更准确。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号