首页> 外文期刊>Document Numerique >Approches de classification pour le filtrage de documents importants au sujet d'une entité nommée
【24h】

Approches de classification pour le filtrage de documents importants au sujet d'une entité nommée

机译:用于过滤有关命名实体的重要文档的分类方法

获取原文
获取原文并翻译 | 示例
       

摘要

Nous souhaitons filtrer un flux de documents web selon qu'ils mentionnent ou non une entité donnée, tout en mesurant l'importance de l'information présente concernant cette entité. Notre approche repose sur l'utilisation de classifieurs prenant en compte des indices comme la fréquence des mentions de l'entité au fil du temps et dans les documents, leurs positions ou encore la présence d'entités liées connues. Notre approche a été évaluée via les tâches "Knowledge Base Acceleration" de TREC 2012 et 2013, et classée parmi les plus performantes.%Our aim is to filter a stream of Web documents according to whether they refer or not an entity, while estimating the importance of the information contained about this entity. Our approach relies on the use of classifiers taking into account features such as the frequency of the entity over time and in the documents, their positions and the presence of known related entities. Our approach was evaluated during "Knowledge Base Acceleration" tracks of TREC 2012 and 2013 and has been ranked among the best ones.
机译:我们要根据网络文档是否提及给定实体来过滤Web文档流,同时测量有关该实体的信息的重要性。我们的方法基于分类器的使用,并考虑到索引,例如随着时间推移和在文档中提到实体的频率,它们的位置或已知相关实体的存在。我们的方法是通过TREC 2012和2013的“知识基础加速”任务进行评估的,并且在性能方面名列前茅。%我们的目标是根据是否引用实体来过滤Web文档流,同时估算有关此实体的信息的重要性。我们的方法依靠分类器的使用,考虑到诸如实体随时间和在文档中的频率,它们的位置以及已知相关实体的存在等特征。我们的方法在TREC 2012和2013的“知识基础加速”历程中得到了评估,并被评为最佳方法之一。

著录项

  • 来源
    《Document Numerique》 |2014年第1期|9-36|共28页
  • 作者单位

    Université d'Avignon et des Pays de Vaucluse, LIA Agroparc-BP 91228-339, chemin des Meinajariès 84911 Avignon Cedex 9, France;

    Kware 565 Rue Marcelin Berthelot 13851 Aix-en-Provence Cedex 3, France,Aix-Marseille Université CNRS, LSIS UMR 7296 Av. Escadrille Normandie Niemen 13397 Marseille Cedex 20, France;

    Aix-Marseille Université CNRS, LSIS UMR 7296 Av. Escadrille Normandie Niemen 13397 Marseille Cedex 20, France;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 fre
  • 中图分类
  • 关键词

    filtrage; entité nommée; TREC KBA; forêt d'arbres décisionnels; classification;

    机译:过滤命名实体;TREC KBA;决策树森林;分类;
  • 入库时间 2022-08-18 01:23:08

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号