首页> 外文期刊>電子情報通信学会技術研究報告 >AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識
【24h】

AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識

机译:使用AAM提取人脸方向健壮的嘴唇区域特征并通过语音特征识别构音障碍

获取原文
获取原文并翻译 | 示例
           

摘要

We investigated the speech recognition of a person with articulation disorders resulting from athetoid cerebral palsy. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we use multiple acoustic frames as an acoustic feature to solve this problem. Further, in a real environment, the speech recognition systems do not have sufficient performance due to noise influence. In addition to acoustic features, visual features are used to increase noise robustness in a real environment. However, there is a recognition problem due to the tendency of his/her unsettling head movement. We investigate a pose-robust audio-visual speech recognition method using Active Appearance Model (AAM) to solve this problem.%本稿では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の場合,筋肉の緊張のため発話が不安定になりやすく,発話時に頭が動いてしまう場合がある.これに対して,音声特徴としてデルタケプストラム係数のセグメント特徴量を用いる.また,発話時の頭部の動きに対しては,Active Appearance Model(AAM)を用いることで画像から顔方位にロバストな唇領域特徴を抽出し,音声特徴と共に用いることで,雑音の影響を受けず発話変動を考慮したマルチモーダル音声認識を検討する.
机译:我们研究了患有因动脉粥样硬化性脑瘫而引起的发音障碍患者的语音识别,由于与语音相关的肌肉受到拉伤,语音的发音趋于变得不稳定,从而导致语音识别能力下降。声学特征解决了该问题,此外,在真实环境中,语音识别系统由于噪声的影响而没有足够的性能,除了声学特征之外,视觉特征还被用于提高真实环境中的噪声鲁棒性。由于他/她的头部活动不稳定,因此存在识别问题。我们研究了一种使用主动外观模型(AAM)的姿势稳健的视听语音识别方法来解决此问题。%本文由于动脉粥样硬化性脑瘫我们将研究构音障碍的语音识别,如果是肢体型构音障碍,语音会由于肌肉紧张而变得不稳定,发声时头部可能会移动。增量倒频谱系数的分段特征量用作特征,活动外观模型(AAM)用于语音期间头部的移动,并且从图像改变了面部朝向。通过提取半身嘴唇区域特征并将其与语音特征一起使用,我们研究了不受噪声影响并考虑语音变化的多模式语音识别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号