【24h】

A Multilingual Evaluation of Three Spelling Normalisation Methods for Historical Text

机译:历史文本三种拼写规范化方法的多语言评价

获取原文

摘要

We present a multilingual evaluation of approaches for spelling normalisation of historical text based on data from five languages: English, German, Hungarian, Icelandic, and Swedish. Three different normalisation methods are evaluated: a simplistic filtering model, a Levenshtein-based approach, and a character-based statistical machine translation approach. The evaluation shows that the machine translation approach often gives the best results, but also that all approaches improve over the baseline and that no single method works best for all languages.
机译:我们对基于五种语言的数据绘制历史文本拼写规范化的方法进行了多语言评估:英语,德语,匈牙利语,冰岛和瑞典语。 评估了三种不同的归一化方法:简单的过滤模型,基于levenshtein的方法和基于角色的统计机器翻译方法。 评估表明,机器翻译方法经常提供最佳结果,也是所有方法都改进了基线,并且没有单一方法最适合所有语言。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号