【24h】

Multilingual Factor Analysis

机译:多语言因素分析

获取原文

摘要

In this work we approach the task of learning multilingual word representations in an offline manner by fitting a generative latent variable model to a multilingual dictionary. We model equivalent words in different languages as different views of the same word generated by a common latent variable representing their latent lexical meaning. We explore the task of alignment by querying the fitted model for multilingual embeddings achieving competitive results across a variety of tasks. The proposed model is robust to noise in the embedding space making it a suitable method for distributed representations learned from noisy corpora.
机译:在这项工作中,我们通过将生成潜伏变量模型拟合到多语言词典来实现以离线方式学习多语言单词表示的任务。我们将不同语言中的等效单词建模为由表示其潜在词汇含义的公共潜在变量生成的同一单词的不同视图。我们通过查询多语言嵌入的拟合模型来探索对齐任务,从而在各种任务中获得竞争性结果。所提出的模型对嵌入空间中的噪声具有鲁棒性,使其成为从嘈杂语料库中学习到的分布式表示的合适方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号