【24h】

PR + RQ ≈ PQ: Transliteration Mining Using Bridge Language

机译:PR + RQ≈PQ:使用桥梁语言进行音译挖掘

获取原文

摘要

We address the problem of mining name transliterations from comparable corpora in languages P and Q in the following resource-poor scenario:1. Parallel names in PQ are not available for training.2. Parallel names in PR and RQ are available for training. We propose a novel solution for the problem by computing a common geometric feature space for P, Q and R where name transliterations are mapped to similar vectors. We employ Canonical Correlation Analysis (CCA) to compute the common geometric feature space using only parallel names in PR and RQ and without requiring parallel names in PQ. We test our algorithm on data sets in several languages and show that it gives results comparable to the state-of-the-art transliteration mining algorithms that use parallel names in PQ for training.
机译:我们在以下资源差的方案中解决了语言中的可比语料库的挖掘名称音译问题: 1. PQ中的并行名称不可用于培训。 2. PR和RQ中的并行名称可用于培训。我们通过计算用于P,Q和R的公共几何特征空间来提出一个问题的新解决方案,其中名称音译被映射到类似的向量。我们使用规范相关性分析(CCA)来计算公共和RQ中的并行名称,并且在PQ中仅需要并行名称。我们以多种语言测试我们的数据集算法,并表明它提供了与最先进的音译挖掘算法相当的结果,该算法在PQ中使用PQ进行培训。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号