【24h】

Visual Speech Recognition Using Motion Features and Hidden Markov Models

机译:使用运动特征和隐马尔可夫模型的视觉语音识别

获取原文
获取原文并翻译 | 示例

摘要

This paper presents a novel visual speech recognition approach based on motion segmentation and hidden Markov models (HMM). The proposed method identifies utterances from mouth video, without evaluating voice signals. The facial movements in the video data are represented using 2D spatial-temporal templates (STT). The proposed technique combines discrete stationary wavelet transform (SWT) and Zernike moments to extract rotation invariant features from the STTs. HMMs are used as speech classifier to model English phonemes. The preliminary results demonstrate that the proposed technique is suitable for phoneme classification with a high accuracy.
机译:本文提出了一种基于运动分割和隐马尔可夫模型(HMM)的新型视觉语音识别方法。所提出的方法从口头视频中识别话语,而无需评估语音信号。视频数据中的面部运动使用2D时空模板(STT)表示。所提出的技术结合了离散平稳小波变换(SWT)和Zernike矩,以从STT中提取旋转不变特征。 HMM用作对英语音素建模的语音分类器。初步结果表明,所提出的技术适用于高精度的音素分类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号