首页> 外文会议>Biennial international workshop on Balto-Slavic natural language processing >Modernizing Historical Slovene Words with Character-Based SMT
【24h】

Modernizing Historical Slovene Words with Character-Based SMT

机译:现代化与基于角色的SMT的历史奴役词

获取原文

摘要

We propose a language-independent word normalization method exemplified on modernizing historical Slovene words. Our method relies on character-based statistical machine translation and uses only shallow knowledge. We present the relevant lexicons and two experiments. In one, we use a lexicon of historical word-contemporary word pairs and a list of contemporary words; in the other, we only use a list of historical words and one of contemporary ones. We show that both methods produce significantly better results than the baseline.
机译:我们提出了一种独立于语言的文字归一化方法,示出了现代化的历史斯洛罗文词。我们的方法依赖于基于角色的统计机器翻译,仅使用浅层知识。我们提出了相关的词典和两个实验。在一个中,我们使用历史词 - 当代词对的词典和当代词汇清单;另一方面,我们只使用历史单词和当代之一的名单。我们表明,两种方法都比基线产生明显的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号