首页> 外文OA文献 >Adapting SMT Query Translation Reranker to New Languages in Cross-Lingual Information Retrieval
【2h】

Adapting SMT Query Translation Reranker to New Languages in Cross-Lingual Information Retrieval

机译:在跨语言信息检索中使SMT查询翻译翻译器适应新语言

摘要

We investigate adaptation of a supervised machine learning model for reranking of query translations to new languages in the context of cross-lingual information retrieval. The model is trained to rerank multiple translations produced by a statistical machine translation system and optimize retrieval quality. The model features do not depend on the source language and thus allow the model to be trained on query translations coming from multiple languages. In this paper, we explore how this affects the final retrieval quality. The experiments are conducted on medical-domain test collection in English and multilingual queries (in Czech, German, French) from the CLEF eHealth Lab series 2013--2015.We adapt our method to allow reranking of query translations for four new languages (Spanish, Hungarian, Polish, Swedish). The baseline approach, where a single model is trained for each source language on query translations from that language, is compared with a model co-trained on translations from the three original languages.
机译:我们研究了一种监督机器学习模型的改编,该模型用于在跨语言信息检索的上下文中将查询翻译重新排序为新语言。训练模型可以对统计机器翻译系统产生的多种翻译进行重新排名,并优化检索质量。模型功能不依赖于源语言,因此可以在来自多种语言的查询翻译中训练模型。在本文中,我们探讨了这如何影响最终检索质量。该实验是针对2013-2015年CLEF电子卫生实验室系列中英语和多语言查询(捷克语,德语,法语)的医学领域测试集合进行的,我们采用了我们的方法,可以对四种新语言的查询翻译进行重新排名(西班牙语,匈牙利文,波兰文,瑞典文)。将基线方法(其中针对每种源语言针对来自该语言的查询翻译训练一种模型)与针对三种原始语言的翻译进行共同训练的模型进行比较。

著录项

  • 作者

    Pecina Pavel; Saleh Shadi;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号