首页> 外文期刊>Document Numerique >Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux
【24h】

Apprentissage en temps réel pour la collecte d'information dans les réseaux sociaux

机译:实时学习以收集社交网络中的信息

获取原文
获取原文并翻译 | 示例
       

摘要

Dans cet article nous nous intéressons à la collecte d'information dans les réseaux sociaux. Cette tâche, primordiale pour de nombreuses applications, se heurte souvent à diverses contraintes liées aux ressources à disposition ou à des restrictions imposées par les API des médias considérés. Nous formulons cette tâche comme un problème de sélection dynamique de sources, pour lequel nous proposons une méthode d'apprentissage pour orienter la collecte vers les données les plus pertinentes en fonction d'un besoin spécifié. Notre méthode est basée sur une extension d'un algorithme de bandit combinatoire récemment proposé. Nous fournissons des garanties théoriques sur le comportement de l'algorithme, que nous évaluons ensuite sur différents jeux de données Twitter, à la fois hors ligne et en ligne, pour différents besoins de données exprimés.%We consider the problem of capturing information on social media under bounded resource. The latter may correspond to real time constraints such as response time limitation, limited computing resources, or social media API restrictions. We formulate this problem as a dynamic source selection problem. We then propose a machine learning methodology for dynamically selecting the most relevant information sources for a given information need. This method is based on an extension of a recently proposed combinatorial bandit algorithm. We provide theoretical guarantees on the behavior of the algorithm. We then evaluate the algorithm on different Twitter datasets for both offline and online settings.
机译:在本文中,我们有兴趣收集社交网络中的信息。对于许多应用程序而言必不可少的这项任务通常会面临与可用资源有关的各种限制,或所涉及媒体的API施加的限制。我们将此任务表述为动态源选择问题,为此,我们提出了一种学习方法,可根据指定的需求将收集指向最相关的数据。我们的方法基于最近提出的组合式强盗算法的扩展。我们为算法的行为提供了理论上的保证,然后针对不同的表达数据需求,对离线和在线的不同Twitter数据集进行了评估。%我们考虑了在社交网络上捕获信息的问题。有限资源下的媒体。后者可能对应于实时限制,例如响应时间限制,有限的计算资源或社交媒体API限制。我们将此问题公式化为动态源选择问题。然后,我们提出了一种机器学习方法,用于针对给定的信息需求动态选择最相关的信息源。该方法基于最近提出的组合式强盗算法的扩展。我们为算法的行为提供了理论上的保证。然后,我们针对离线和在线设置在不同的Twitter数据集上评估该算法。

著录项

  • 来源
    《Document Numerique》 |2015年第3期|39-58|共20页
  • 作者单位

    IRT SystemX, 8 Avenue de la Vauve, 91120 Palaiseau, France,Sorbonne Universités, UPMC Univ Paris 06, CNRS, LIP6 UMR 7606, 4 place Jussieu 75005 Paris, France;

    Sorbonne Universités, UPMC Univ Paris 06, CNRS, LIP6 UMR 7606, 4 place Jussieu 75005 Paris, France;

    Sorbonne Universités, UPMC Univ Paris 06, CNRS, LIP6 UMR 7606, 4 place Jussieu 75005 Paris, France;

    Sorbonne Universités, UPMC Univ Paris 06, CNRS, LIP6 UMR 7606, 4 place Jussieu 75005 Paris, France;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 fre
  • 中图分类
  • 关键词

    apprentissage statistique; réseaux sociaux; bandit manchot;

    机译:统计学习;社交媒体;武装匪;
  • 入库时间 2022-08-18 01:22:45

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号