AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識

宮本　千琴; 駒井　祐人; 滝口　哲也; 有木　康雄; 李　義昭; 中林　稔亮

首页> 外文期刊>電子情報通信学会技術研究報告 >AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識

【24h】

AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識

机译：使用AAM提取人脸方向健壮的嘴唇区域特征并通过语音特征识别构音障碍

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We investigated the speech recognition of a person with articulation disorders resulting from athetoid cerebral palsy. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we use multiple acoustic frames as an acoustic feature to solve this problem. Further, in a real environment, the speech recognition systems do not have sufficient performance due to noise influence. In addition to acoustic features, visual features are used to increase noise robustness in a real environment. However, there is a recognition problem due to the tendency of his/her unsettling head movement. We investigate a pose-robust audio-visual speech recognition method using Active Appearance Model (AAM) to solve this problem.%本稿では，アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の場合，筋肉の緊張のため発話が不安定になりやすく，発話時に頭が動いてしまう場合がある.これに対して，音声特徴としてデルタケプストラム係数のセグメント特徴量を用いる.また，発話時の頭部の動きに対しては，Active Appearance Model（AAM）を用いることで画像から顔方位にロバストな唇領域特徴を抽出し，音声特徴と共に用いることで，雑音の影響を受けず発話変動を考慮したマルチモーダル音声認識を検討する.

机译：我们研究了患有因动脉粥样硬化性脑瘫而引起的发音障碍患者的语音识别，由于与语音相关的肌肉受到拉伤，语音的发音趋于变得不稳定，从而导致语音识别能力下降。声学特征解决了该问题，此外，在真实环境中，语音识别系统由于噪声的影响而没有足够的性能，除了声学特征之外，视觉特征还被用于提高真实环境中的噪声鲁棒性。由于他/她的头部活动不稳定，因此存在识别问题。我们研究了一种使用主动外观模型（AAM）的姿势稳健的视听语音识别方法来解决此问题。％本文由于动脉粥样硬化性脑瘫我们将研究构音障碍的语音识别，如果是肢体型构音障碍，语音会由于肌肉紧张而变得不稳定，发声时头部可能会移动。增量倒频谱系数的分段特征量用作特征，活动外观模型（AAM）用于语音期间头部的移动，并且从图像改变了面部朝向。通过提取半身嘴唇区域特征并将其与语音特征一起使用，我们研究了不受噪声影响并考虑语音变化的多模式语音识别。

著录项

来源
《電子情報通信学会技術研究報告》 |2009年第355期|p.195-200|共6页
作者
宮本　千琴; 駒井　祐人; 滝口　哲也; 有木　康雄; 李　義昭; 中林　稔亮;
展开▼
作者单位

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

追手門学院大学経済学部　〒567-8502　大阪府茨木市西安威2-1-15;

神戸大学発達科学部　〒657-8501　兵庫県神戸市灘区鶴甲3-11;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
構音障害; マルチモーダル音声認識; active appearance model;

机译：口齿障碍;多模态语音识别;主动出现模型;

相似文献

外文文献
中文文献
专利

1. AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 [J] . 宮本千琴, 駒井祐人, 滝口哲也, 電子情報通信学会技術研究報告. 音声. Speech . 2009,第356期

机译：使用AAM可以对脸部方向进行鲁棒的嘴唇区域特征提取，并通过语音特征对发音异常的人进行语音识别
2. AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 [J] . 宮本千琴, 駒井祐人, 滝口哲也, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2009,第355期

机译：使用AAM可以对脸部方向进行鲁棒的嘴唇区域特征提取，并通过语音特征对发音异常的人进行语音识别
3. AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識 [J] . 宮本　千琴, 駒井　祐人, 滝口　哲也, 電子情報通信学会技術研究報告 . 2009,第356期

机译：使用AAM提取人脸方向健壮的嘴唇区域特征并通过语音特征识别构音障碍
4. 室内シーン画像におけるSIFT 特徴量を用いたテンプレートマッチングによる物体存在領域の抽出と物体認識：不可視床マーク，部分テンプレート，物体と床との拘束関係，およびハーライク特徴量により検出される形状情報の利用 [C] . 小浜篤, 服部信彦, 駒井翔, 精密工学会大会学術講演会 . 2009

机译：通过模板匹配使用室内场景图像中的SIFT特征量来提取物体存在区域：对象识别：侵入性标记，部分模板，物体和地板之间的约束关系，以及仇恨特征量检测到的形状信息
5. 独立した両手動作による両手間干渉の特徴と両手間優位性の違い～両手動作スキルの異なる3群間の比較～ [D] . 平船雄三 2019

机译：独立双手运动和双手优势差异导致的双手间干扰的特征-具有不同双手运动技巧的三组之间的比较-
6. サービスロボットシステムのための全方位カメラによるトラッキング可能特徴点とインタラクション距離情報を用いた人物検出 [O] . Tasaki Tsuyoshi 2013

机译：服务机器人系统中利用可跟踪特征点和交互距离信息与全向摄像机进行人体检测

AAMを用いた顔方位にロバストな唇領域特徴抽出と音声特徴による構音障害者の音声認識

摘要

著录项

相似文献

相关主题

期刊订阅