首页> 外文期刊>IEICE Transactions on Information and Systems >Lip Location Normalized Training for Visual Speech Recognition
【24h】

Lip Location Normalized Training for Visual Speech Recognition

机译:嘴唇位置归一化训练用于视觉语音识别

获取原文
获取原文并翻译 | 示例
       

摘要

This paper describes a method to normalize the lip position for improving the performance of a visual- information-based speech recognition system. Basically, there are two types of information useful in speech recognition pro- cesses; the first one is the speech signal itself and the second one is the visual information from the lips in motion. This paper tries to solve some problems caused by using images from the lips in motion such as the effect produced by the variation of the lip location.
机译:本文介绍了一种方法来标准化嘴唇的位置,以改善基于视觉信息的语音识别系统的性能。基本上,在语音识别过程中有两种有用的信息:第一个是语音信号本身,第二个是来自运动中的嘴唇的视觉信息。本文试图解决由于使用嘴唇运动图像而引起的一些问题,例如由于嘴唇位置变化而产生的效果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号