首页> 外文期刊>Document Numerique >Thésaurus distributionnels pour la recherche d'information et vice-versa
【24h】

Thésaurus distributionnels pour la recherche d'information et vice-versa

机译:用于信息检索的分布式叙词表,反之亦然

获取原文
获取原文并翻译 | 示例
       

摘要

Distributional thesauri are useful in many tasks of Natural Language Processing. In this paper, we address the problem of building and evaluating such thesauri with the help of Information Retrieval concepts. Two main contributions are proposed. First, in the continuation of the work of Claveau et al., 2014, we show how IR tools and concepts can be used with success to build thesaurus. Through several experiments and by evaluating directly the results with reference lexicons, we show that some IR models outperform state-of-the-art systems. Secondly, we use IR as an application framework to indirectly evaluate the generated thesaurus. Here again, this task-based evaluation validate the IR approach used to build the thesaurus. Moreover, it allows us to compare these results with those from the direct evaluation framework used in the literature. The observed differences question these evaluation habits.%Les thésaurus distributionnels sont utiles à de nombreuses tâches du traitement automatique des langues. Dans cet article, nous abordons les problèmes de leur construction et de leur évaluation sous l'angle de la recherche d'information. Deux contributions sont proposées. D'une part, en poursuite des travaux initiés par Claveau et al., 2014, nous montrons comment les techniques de RI peuvent être utilisées avec succès pour construire ces thésaurus. Au moyen d'une évaluation directe par comparaison avec des lexiques de référence et au travers de plusieurs expérimentations, nous montrons que les résultats obtenus par des modèles de RI dépassent les performances des systèmes état de l'art. D'autre part, nous utilisons la RI comme cadre applicatif pour proposer une évaluation indirecte des thésaurus produits. Là encore, cette évaluation valide l'approche. Mais surtout, elle permet de mettre en regard les performances obtenues sur cette tâche avec celles des évaluations directes utilisées dans la littérature. Les différences constatées remettent en cause en partie ces pratiques d'évaluation.
机译:分布式叙词表在自然语言处理的许多任务中很有用。在本文中,我们借助信息检索概念解决了构建和评估叙词表的问题。提出了两个主要贡献。首先,在继续Claveau等人(2014年)的工作中,我们展示了如何成功使用IR工具和概念来构建同义词库。通过几次实验,并通过直接用参考词典评估结果,我们证明了某些IR模型的性能优于最先进的系统。其次,我们使用IR作为应用程序框架来间接评估生成的同义词库。同样,基于任务的评估再次验证了用于构建同义词库的IR方法。此外,它使我们能够将这些结果与文献中使用的直接评估框架的结果进行比较。观察到的差异对这些评估习惯提出了质疑。%Les thaus分布中的s utilesàde nombreusesàtraitement automatique des langues。有关Dans cet的文章,《建筑学概论》和《评估指南》等信息。 Deux贡献了许多建议。第一部分,Claveau等人在2014年的著作权诉讼中,Nous montrons评论了RI的技术用途,并成功地建立了该同义词库。法语国家评估和综合实验指导法》,《蒙大拿共和国法》,《共和国标准》和《表演法》。重要的部分是,申请者可以直接向提议者提出评估,也可以间接评估提议的评估结果。再次评估,评估现金的有效性。 Mais Surtout,《评估》上的演出表演指导着效用表彰。引起共产主义差异的原因是参与评估的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号