首页> 外文期刊>Systems Science >COLLECTING POLISH-GERMAN PARALLEL CORPORA IN THE WEB
【24h】

COLLECTING POLISH-GERMAN PARALLEL CORPORA IN THE WEB

机译:在网络中收集波兰语-德语平行语

获取原文
获取原文并翻译 | 示例
       

摘要

Parallel corpus has recently become an indispensable resource in multilingual natural language processing. Manual preparation of a bilingual corpus is a laborious task. Therefore methods for the automated creation of parallel corpus are currently a topic of concern for many researchers. A number of sophisticated and effective algorithms for collecting parallel texts from the Web have already been created. Unfortunately, none of them have been used in the process of Polish-German corpus creation. That is why the aim of the research has been to verify the efficiency of existing algorithms for the collecting of Polish-German parallel corpus, intended as a reference source for a Machine Translation system, to propose a new algorithm and present results achieved by the new algorithm.
机译:并行语料库最近已成为多语言自然语言处理中必不可少的资源。手动准备双语语料库是一项艰巨的任务。因此,自动创建平行语料库的方法目前是许多研究人员关注的话题。已经创建了许多用于从Web收集并行文本的复杂有效的算法。不幸的是,在波兰语-德语语料库的创建过程中都没有使用它们。因此,本研究的目的是验证现有的用于收集波兰语-德语并行语料库的算法的效率,该算法旨在作为机器翻译系统的参考源,以提出一种新算法并介绍新算法所取得的结果算法。

著录项

  • 来源
    《Systems Science》 |2008年第4期|41-45|共5页
  • 作者

    MONIKA ROSINSKA;

  • 作者单位

    Adam Mickiewicz University in Poznan, Faculty of Mathematics and Computer Science;

  • 收录信息 美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    corpus; parallel;

    机译:语料库平行;
  • 入库时间 2022-08-17 23:10:40

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号