首页> 外文期刊>Document Numerique >Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues
【24h】

Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues

机译:统计和语言方法对多语言文档进行语义索引

获取原文
获取原文并翻译 | 示例
       

摘要

Dans cet article nous présentons une approche statistique d'indexation sémantique des documents multilingues. L'approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d'expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l'approche statistique obtient des résultats équivalents à l'approche linguistique sans adapter la phase d'indexation à la langue du document.%This article presents a statistical approach of semantic indexing for multilingual documents. The proposed approach is composed of three stages: extraction of terms, detection of concepts and detection of relations from couples of terms. Our approach is validated by a set of experiments on the ImageCLEFmed 2007 collection and a comparison with a linguistic approach. The experiments show that the statistical approach obtains results equivalent to the linguistic one without adapting the indexing procedure to the document language.
机译:在本文中,我们提出了一种统计方法来对多语言文档进行语义索引。我们提出的方法包括三个阶段:术语提取,概念检测和概念对之间的关​​系检测。我们的方法已通过ImageCLEFmed 2007影像集上的一组实验以及与语言方法的比较而得到验证。我们证明了统计方法获得的结果与语言方法相当,而没有使索引阶段适应文档语言。%本文提出了一种多语言文档语义索引的统计方法。所提出的方法包括三个阶段:术语的提取,概念的检测以及术语对的关系的检测。我们的方法已通过ImageCLEFmed 2007影像集上的一组实验以及与语言方法的比较而得到验证。实验表明,在不使索引编制过程适应文档语言的情况下,统计方法可以获得与语言方法相当的结果。

著录项

  • 来源
    《Document Numerique》 |2011年第2期|p.193-214|共22页
  • 作者单位

    Université de Lyon, CNRS, LIRIS UMR 5205 INSA de Lyon, Université Claude Bernard Lyon 1 Campus de la Doua, Bâtiment Biaise Pascal 20, Avenue Albert Einstein F-69621 Villeurbanne cedex CEMAGREF de Clermont Ferrand 24, Avenue des Landais F-63172 Aubière;

    Université de Lyon, CNRS, LIRIS UMR 5205 INSA de Lyon, Université Claude Bernard Lyon 1 Campus de la Doua, Bâtiment Biaise Pascal 20, Avenue Albert Einstein F-69621 Villeurbanne cedex CEMAGREF de Clermont Ferrand 24, Avenue des Landais F-63172 Aubière;

    Université de Lyon, CNRS, LIRIS UMR 5205 INSA de Lyon, Université Claude Bernard Lyon 1 Campus de la Doua, Bâtiment Biaise Pascal 20, Avenue Albert Einstein F-69621 Villeurbanne cedex CEMAGREF de Clermont Ferrand 24, Avenue des Landais F-63172 Aubière;

    Université de Lyon, CNRS, LIRIS UMR 5205 INSA de Lyon, Université Claude Bernard Lyon 1 Campus de la Doua, Bâtiment Biaise Pascal 20, Avenue Albert Einstein F-69621 Villeurbanne cedex CEMAGREF de Clermont Ferrand 24, Avenue des Landais F-63172 Aubière;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 fre
  • 中图分类
  • 关键词

    recherche d'information; indexation sémantique; ontologie; documents multilingues; analyse linguistique; mesure statistique;

    机译:寻求信息;语义索引本体多语言文件;语言分析;统计量度;
  • 入库时间 2022-08-18 01:24:24

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号