首页> 外文期刊>電子情報通信学会技術研究報告 >構音障害者の音声認識における動的特徴量の考察
【24h】

構音障害者の音声認識における動的特徴量の考察

机译:构音障碍语音识别中动态特征的考虑

获取原文
获取原文并翻译 | 示例
           

摘要

Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of the speech tends to become unstable due to strain of a muscle and that causes degradation of speech recognition. In this paper, we focus on the fact that recognition rate of a person with an articulation disorder decreases compared with that of a physically unimpaired person, expecially in speech recognition using dynamic features only. Therefore, we use multiple acoustic frames as an acoustic feature to solve this problem. Its effectiveness is confirmed by word recognition experiments.%音声認識技術は現在,様々な環境下や場面において使用される機会が増加している.しかし,言語障害などの障害者を対象としたものは非常に少ない.本稿では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の発話スタイルは,筋肉の緊張のため健常者と大きく異なり不安定であるため,特定話者モデルでの音声認識には限界がある.特に構音障害者の動的特徴量(デルタケプストラム)の認識精度は健常者に比べて大きく低下する.これに対し本稿では,動的特徴量の代わりに,デルタケプストラム係数のセグメント特徴量を用いることで構音障害者の音声認識精度の改善を試み,その有効性を示す.
机译:近来,通过使用语音的随机建模,显着提高了与说话者无关的语音识别的准确性。但是,对口语挑战者(例如有语言障碍的人)的研究很少。因此,我们已经尝试为具有发音障碍的人建立声学模型。由于肌肉的拉力,语音的发音趋于变得不稳定,并且这导致语音识别的劣化。在本文中,我们着眼于这样一个事实,即具有发音障碍的人的识别率比没有肢体障碍的人的识别率降低,尤其是在仅使用动态特征的语音识别中。因此,我们使用多个声学框架作为声学特征来解决此问题。音,言语障害などの障害者を対象としたものは非常に少ない。本稿では,アテトーゼ型脳性麻痹による构音障害者の音声认识の検讨を行う。特に构音障害者の动的特徴量(デルタケプストラム)の认识精度は健常者に比べて大きく低下する。これに対し本稿では,动的特徴量の代わりに,デルタケプストラム系数のセグメント特徴量を用いることで构音障害者の音声认识精度の改善を试み,その有效を示す。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号