首页> 外文会议>22nd International Conference on Computational Linguistics >Normalizing SMS: are two metaphors better than one ?
【24h】

Normalizing SMS: are two metaphors better than one ?

机译:规范短信:两个隐喻比一个更好吗?

获取原文
获取原文并翻译 | 示例

摘要

Electronic written texts used in computer-mediated interactions (e-mails, blogs, chats, etc) present major deviations from the norm of the language. This paper presents an comparative study of systems aiming at normalizing the orthography of French SMS messages: after discussing the linguistic peculiarities of these messages, and possible approaches to their automatic normalization, we present, evaluate and contrast two systems, one drawing inspiration from the Machine Translation task; the other using techniques that are commonly used in automatic speech recognition devices. Combining both approaches, our best normalization system achieves about 11 % Word Error Rate on a test set of about 3000 unseen messages.
机译:计算机介导的交互中使用的电子书面文本(电子邮件,博客,聊天等)与语言规范存在重大差异。本文对旨在规范法国SMS消息正字法的系统进行了比较研究:在讨论了这些消息的语言特点以及自动归一化的可能方法之后,我们介绍,评估和对比了两个系统,其中一个系统是从机器中汲取灵感的翻译任务;其他使用自动语音识别设备中常用的技术。结合这两种方法,我们最好的规范化系统可以在约3000条看不见的消息的测试集上实现约11%的字错误率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号