首页> 外文会议>International Conference on Systems and Informatics >The Method of Micro-blog Article Retrieval Based on Text Similarity
【24h】

The Method of Micro-blog Article Retrieval Based on Text Similarity

机译:基于文本相似性的微博文本检索方法

获取原文

摘要

With the growth of micro-blog users, the number of micro-blog text is also showing an explosive growth trend. Faced with such a large amount of text data, how to effectively retrieve useful information is very important for micro-blog users. This paper proposes a method combining traditional TF-IDF computing and LDA topic model. First, we compute by TF-IDF to find micro-blog articles about word frequency similarity. Then we use the LDA topic model approach to filter out micro-blog articles with similar themes. Experimental results show that using the integrated search method, users can retrieve more suitable user's actual needs micro-blog articles.
机译:随着微博用户的增长,微博文本的数量也显示出爆炸性的增长趋势。面对这么大量的文本数据,如何有效地检索有用的信息对微博用户来说非常重要。本文提出了一种结合传统TF-IDF计算和LDA主题模型的方法。首先,我们通过TF-IDF计算了关于字频率相似性的微博文章。然后我们使用LDA主题模型方法过滤掉具有相似主题的微博文章。实验结果表明,使用集成的搜索方法,用户可以检索更多合适的用户实际需要微博文章。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号