首页> 外文OA文献 >Improving microblog retrieval from exterior corpus by automatically constructing a microblogging corpus
【2h】

Improving microblog retrieval from exterior corpus by automatically constructing a microblogging corpus

机译:通过自动构建微博语料库改进外部语料库的微博检索

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

A large-scale training corpus consisting of microblogs belonging to a desired category is important for highaccuracy microblog retrieval. Obtaining such a large-scale microblgging corpus manually is very time and laborconsuming. Therefore, some models for the automatic retrieval of microblogs from an exterior corpus have been proposed. However, these approaches may fail in considering microblog-specific features. To alleviate this issue, we propose a methodology that constructs a simulated microblogging corpus rather than directly building a model from the exterior corpus. The performance of our model is better since the microblog-special knowledge of the microblogging corpus is used in the end by the retrieval model. Experimental results on real-world microblogs demonstrate the superiority of our technique compared to the previous approaches.
机译:由属于所需类别的微博组成的大规模培训语料库对于高精度微博检索非常重要。手动获得如此大规模的微化语料库非常耗时且费力。因此,已经提出了一些用于从外部语料库自动检索微博的模型。但是,这些方法可能无法考虑微博特有的功能。为了缓解此问题,我们提出了一种方法,该方法可构建模拟的微博语料,而不是直接从外部语料库构建模型。由于检索模型最后使用了微博语料库的微博特殊知识,因此我们模型的性能更好。在现实世界的微博上的实验结果表明,与以前的方法相比,我们的技术具有优越性。

著录项

  • 作者

    Tu W; Mamoulis N; Cheung D;

  • 作者单位
  • 年度 2015
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号