首页> 外文会议>International Conference on Natural Language Processing and Chinese Computing >Learning Bilingual Lexicon for Low-Resource Language Pairs
【24h】

Learning Bilingual Lexicon for Low-Resource Language Pairs

机译:用于低资源语言对的双语词典

获取原文

摘要

Learning bilingual lexicon from monolingual data is a novel idea in natural language process which can benefit many low-resource language pairs. In this paper, we present an approach for obtaining bilingual lexicon from monolingual data. Our method only requires a small seed bilingual lexicon and we use the Canonical Correlation Analysis to construct a shared latent space to explain two monolingual embeddings how to be linked. Experimental results show that a considerable precision and size bilingual lexicon can be learned in Chinese-Uyghur and Chinese-Kazakh monolingual data.
机译:从单语言数据学习双语词汇是自然语言过程中的一个新的想法,可以使许多低资源语言对有益。在本文中,我们提出了一种从单机数据获取双语词典的方法。我们的方法只需要一个小种子双语词典,我们使用规范相关性分析来构建共享潜在的空间来解释两个单机嵌入方式如何链接。实验结果表明,在中国 - uyghur和中国哈萨克单晶体数据中可以学习相当大的精度和大小的双语词典。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号