首页> 外文会议>Conference on empirical methods in natural language processing;Workshop on computational approaches to code switching >Word-level Language Identification using CRF: Code-switching Shared Task Report of MSR India System
【24h】

Word-level Language Identification using CRF: Code-switching Shared Task Report of MSR India System

机译:单词级语言识别使用CRF:Code-Switching MSR印度系统的共享任务报告

获取原文
获取外文期刊封面目录资料

摘要

We describe a CRF based system for word-level language identification of code-mixed text. Our method uses lexical, contextual, character n-gram, and special character features, and therefore, can easily be replicated across languages. Its performance is benchmarked against the test sets provided by the shared task on code-mixing (Solorio et al., 2014) for four language pairs, namely, English-Spanish (En-Es), English-Nepali (En-Ne), English-Mandarin (En-Cn), and Standard Arabic-Arabic (Ar-Ar) Dialects. The experimental results show a consistent performance across the language pairs.
机译:我们描述了基于CRF的编码语言识别CRF系统。 我们的方法使用词汇,上下文,字符n-gram和特殊字符特征,因此可以轻松地跨语言复制。 其性能与代码混合的共享任务提供的测试集(Solorio等,2014)为四种语言对,即英语 - 西班牙语(EN-NE),英语 - 尼泊尔(EN-NE), 英语 - 普通话(EN-CN)和标准阿拉伯语(AR-AR)方言。 实验结果表明,跨语言对的一致性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号