【24h】

On-Demand Language Model Interpolation for Mobile Speech Input

机译:移动语音输入的按需语言模型插值

获取原文

摘要

Google offers several speech features on the Android mobile operating system: search by voice, voice input to any text field, and an API for application developers. As a result, our speech recognition service must support a wide range of usage scenarios and speaking styles: relatively short search queries, addresses, business names, dictated SMS and e-mail messages, and a long tail of spoken input to any of the applications users may install. We present a method of on-demand language model interpolation in which contextual information about each utterance determines interpolation weights among a number of n-gram language models. On-demand interpolation results in an 11.2% relative reduction in WER compared to using a single anguage model to handle all traffic.
机译:Google在Android移动操作系统上提供了多种语音功能:通过语音搜索,对任何文本字段的语音输入以及面向应用程序开发人员的API。因此,我们的语音识别服务必须支持广泛的使用场景和讲话方式:相对较短的搜索查询,地址,公司名称,指定的SMS和电子邮件,以及对任何应用程序的语音输入很长的尾巴用户可以安装。我们提出了一种按需语言模型插值的方法,其中有关每个语音的上下文信息确定了许多n-gram语言模型之间的插值权重。与使用单一语言模型处理所有流量相比,按需插值可将WER相对降低11.2%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号