首页> 外文会议>International Conference on Speech and Computer >Code-Switching Language Modeling with Bilingual Word Embeddings: A Case Study for Egyptian Arabic-English
【24h】

Code-Switching Language Modeling with Bilingual Word Embeddings: A Case Study for Egyptian Arabic-English

机译:带有双语词嵌入的代码转换语言建模:埃及阿拉伯语-英语案例研究

获取原文

摘要

Code-switching (CS) is a widespread phenomenon among bilingual and multilingual societies. The lack of CS resources hinders the performance of many NLP tasks. In this work, we explore the potential use of bilingual word embeddings for code-switching (CS) language modeling (LM) in the low resource Egyptian Arabic-English language. We evaluate different state-of-the-art bilingual word embeddings approaches that require cross-lingual resources at different levels and propose an innovative but simple approach that jointly learns bilingual word representations without the use of any parallel data, relying only on monolingual and a small amount of CS data. While all representations improve CS LM, ours performs the best and improves perplexity 33.5% relative over the baseline.
机译:代码切换(CS)是双语和多语言社会中的一种普遍现象。 CS资源的缺乏阻碍了许多NLP任务的执行。在这项工作中,我们探索了双语单词嵌入在资源贫乏的埃及阿拉伯语-英语语言中用于代码转换(CS)语言建模(LM)的潜在用途。我们评估了需要在不同级别使用跨语言资源的不同的最新双语单词嵌入方法,并提出了一种创新而简单的方法,该方法可联合学习双语单词表示而无需使用任何并行数据,仅依赖于单语言和少量的CS数据。尽管所有表示形式都改善了CS LM,但相对于基线,我们的表现最佳,并且将困惑度提高了33.5%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号