首页> 外文OA文献 >Kannada and Telugu Native Languages to English Cross Language Information Retrieval
【2h】

Kannada and Telugu Native Languages to English Cross Language Information Retrieval

机译:卡纳达语和泰卢固语母语到英语交叉语言信息检索

摘要

One of the crucial challenges in cross lingualudinformation retrieval is the retrieval of relevant information foruda query expressed in as native language. While retrieval ofudrelevant documents is slightly easier, analysing the relevance ofudthe retrieved documents and the presentation of the results toudthe users are non-trivial tasks. To accomplish the above task,udwe present our Kannada English and Telugu English CLIRudsystems as part of Ad-Hoc Bilingual task. We take a queryudtranslation based approach using bi-lingual dictionaries. Whenuda query words not found in the dictionary then the words areudtransliterated using a simple rule based approach whichudutilizes the corpus to return the ‘k’ closest Englishudtransliterations of the given Kannada/Telugu word. Theudresulting multiple translation/transliteration choices for eachudquery word are disambiguated using an iterative page-rankudstyle algorithm which, based on term-term co-occurrenceudstatistics, produces the final translated query. Finally weudconduct experiments on these translated query using audKannada/Telugu document collection and a set of Englishudqueries to report the improvements, performance achieved forudeach task is to be presented and statistical analysis of theseudresults are given.
机译:跨语言双信息检索中的关键挑战之一是检索以母语表示的 uda查询的相关信息。虽然检索不相关的文档稍微容易一些,但是分析检索的文档的相关性以及将结果呈现给 udd的用户并非易事。为了完成上述任务, udwe介绍了我们的卡纳达语英语和泰卢固语英语CLIR udsystem,这是Ad-Hoc双语任务的一部分。我们使用使用双语词典的基于查询 udtranslation的方法。当在字典中找不到 uda查询单词时,会使用基于规则的简单方法对单词进行udtransliterliter,该方法会利用语料库返回给定的Kannada / Telugu单词的“ k”个最接近的英语 udtransliteration。使用迭代的页面排名 udstyle算法消除了每个 udquery词的 udresulting多个翻译/音译选择,该算法基于词项共现 udstatistics生成最终的翻译查询。最后,我们使用 udKannada / Telugu文档集合和一组英语 udqueries对翻译后的查询进行了实验,以报告改进情况,将介绍 udeach任务的性能,并对这些 udults进行统计分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号