首页> 外文期刊>Knowledge and information systems >Cross-lingual document similarity estimation and dictionary generation with comparable corpora
【24h】

Cross-lingual document similarity estimation and dictionary generation with comparable corpora

机译:与可比语料库的交叉语言文档相似性估算与字典代

获取原文
获取原文并翻译 | 示例
           

摘要

This paper proposes an approach for performing bilingual dictionary generation even when trained on widely available comparable bilingual corpora. We also show its capability to provide cross-lingual similarity estimates that correlate well with human judgments. We implement an approach using a nonlinear bilingual translation model that we train using comparable corpora. We propose a method using word embeddings and kernel approximation to train scalable nonlinear transformations. We demonstrate that this novel method works better on a majority of evaluated language pairs.
机译:本文提出了一种甚至在广泛可用的双语语料库上培训的方式执行双语词典代的方法。 我们还表明其能力提供与人类判断相相关的交叉语言相似度估计。 我们使用我们使用可比较的基层训练的非线性双语翻译模型来实现一种方法。 我们提出了一种使用Word Embeddings和内核近似的方法,以训练可扩展的非线性变换。 我们证明,这种新的方法在大多数评估语言对上工作更好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号