首页> 外文会议>International Conference on Computational Linguistics >Normalizing SMS: are two metaphors better than one ?
【24h】

Normalizing SMS: are two metaphors better than one ?

机译:正常化短信:两个比喻是一个比一个好吗?

获取原文

摘要

Electronic written texts used in computer-mediated interactions (e-mails, blogs, chats, etc) present major deviations from the norm of the language. This paper presents an comparative study of systems aiming at normalizing the orthography of French SMS messages: after discussing the linguistic peculiarities of these messages, and possible approaches to their automatic normalization, we present, evaluate and contrast two systems, one drawing inspiration from the Machine Translation task; the other using techniques that are commonly used in automatic speech recognition devices. Combining both approaches, our best normalization system achieves about 11 % Word Error Rate on a test set of about 3000 unseen messages.
机译:计算机中介的互动(电子邮件,博客,聊天等)中使用的电子书写文本存在与语言规范的主要偏差。本文介绍了旨在标准化法国短信消息的拼写的系统的比较研究:在讨论这些消息的语言特性之后,以及可能的自动标准化的可能方法,我们展示,评估和对比两个系统,从机器中汲取灵感翻译任务;另一个使用通常用于自动语音识别设备的技术。组合这两种方法,我们的最佳归一化系统在约3000条看不见的消息的测试集上实现了大约11%的字错误率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号