首页> 外文会议>Research and advanced technology for digital libraries >Une technique d'elargissement de requetes fondee sur la similarite de mots pour la recherche d'information inter langues
【24h】

Une technique d'elargissement de requetes fondee sur la similarite de mots pour la recherche d'information inter langues

机译:一种基于单词相似度的请求扩展技术,用于在语言之间搜索信息

获取原文
获取原文并翻译 | 示例

摘要

Nous proposons une technique d'elargissement du champ de recherche d'une requirete pour ameliorer la receher, dans plusieurs langues, de mots ou d'expressions dans un document (meme si la requete contient les mots ou expressions recherches dans une seule langue, le systeme va rechercher leurs equivalents dans plusieurs langues). La recherche do mots ou d'sexpressions en plusieurs langues est fondee sur l'utilisation d'un dictionnaire et se nomme en anglais CLIR (Cross-Language Information Retrieval). Pour resoudre les ambiguites de traduction de mots, nous utilisions une technqiue fondee sur la similarite de mots. Nous aviouns deja propose cette technique dans un travail precedent. Elle servait a rendre plus juste la traduction d'une requete a l'aide d'un dictionnaire. La technique employee pour elargir le champ de recherche d'une requete est alors utilisee pour traduire les requretes afin de rendre la recherche plus pertinente. Nous montrons que combiner les deux techniques afin d'exprimer des requetes de recherche de mots ou d'expressions en trois langues (allemand, espagnol et indonesien) est efficace. Ces requetes servent a interroger une collection de documents ecrits en anglais dans le standard TREC (en anglais, Text Retrieval Conference). Nos experiences montrent que, plus il y a d'expressions dans les requretes, plus les techniques fondees sur la similarite de mots sont performantes. De plus, nos resultats vont dans le meme sens que des travaux de recherche deja effectues. Ceux-ci montraient que la reconnaissance d'expression et la traduction sont cruciaux pour l'efficacite de la methode CLIR.
机译:我们提出了一种技术来拓宽需求的搜索范围,以改善对多种语言的文档中单词或表达式的接收(即使请求包含仅以一种语言搜索的单词或表达式,系统将以几种语言搜索其等效项)。在多种语言中搜索单词或表达是基于词典的使用,并且被称为英语CLIR(跨语言信息检索)。为了解决单词翻译的歧义,我们使用了一种基于单词相似性的技术。我们已经在先前的工作中提出了这种技术。它用于使使用词典的请求翻译更加准确。然后,用于扩大请求搜索范围的技术将用于翻译请求,以使搜索更加相关。我们表明,结合这两种技术以用三种语言(德语,西班牙语和印尼语)表达对单词或表达式的搜索查询是有效的。这些请求用于查询以TREC标准(英语,文本检索会议)的英语书面文档的集合。我们的经验表明,查询中的表达式越多,基于单词相似度的技术越有效。此外,我们的结果与已经进行的研究工作方向相同。这些表明表达识别和翻译对于CLIR方法的有效性至关重要。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号