首页> 外文会议>Annual meeting of the Association for Computational Linguistics >A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining
【24h】

A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining

机译:无监督和半监督音译挖掘的统计模型

获取原文
获取外文期刊封面目录资料

摘要

We propose a novel model to automatically extract transliteration pairs from parallel corpora. Our model is efficient, language pair independent and mines transliteration pairs in a consistent fashion in both unsupervised and semi-supervised settings. We model transliteration mining as an interpolation of transliteration and non-transliteration sub-models. We evaluate on NEWS 2010 shared task data and on parallel corpora with competitive results.
机译:我们提出了一种新颖的模型,可以从并行语料库中自动提取音译对。我们的模型是高效的,语言对独立和挖掘在无监督和半监督的设置中的一致方式中的音译对。我们将音译挖掘模型作为音译的插值和非音译子模型。我们在新闻2010年评为共享任务数据和具有竞争性结果的平行语料库中评估。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号