【24h】

A Comparative Study on Translation Unitsfor Bilingual Lexicon Extraction

机译:双语词典提取中翻译单位的比较研究

获取原文

摘要

This paper presents on-going researchon automatic extraction of bilinguallexicon from English-Japanese parallelcorpora. The main objective ofthis paper is to examine various Ngrammodels of generating translationunits for bilingual lexicon extraction.Three N-gram models, abaseline model (Bound-length N-gram)and two new models (Chunk-bound Ngramand Dependency-linked N-gram)are compared. An experiment with10000 English-Japanese parallel sentencesshows that Chunk-bound Ngramproduces the best result in termsof accuracy (83%) as well as coverage(60%) and it improves approximatelyby 13% in accuracy and by 5-9% incoverage from the previously proposedbaseline model.
机译:本文介绍了正在进行的研究 自动提取双语 英日平行的词典 语料库。主要目的 本文旨在考察各种Ngram 产生翻译的模型 双语词典提取单位。 三种N-gram模型 基线模型(长度N-gram) 和两个新模型(大块绑定的Ngram 和依存关系的N-gram) 比较。一个实验 10000条日语-日语平行句子 显示块绑定的Ngram 产生最好的结果 准确性(83%)以及覆盖率 (60%),大约可以改善 准确度提高了13%,而准确度提高了5-9% 先前提议的覆盖范围 基线模型。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号