首页> 外文期刊>電子情報通信学会技術研究報告 >メタモデルと音響モデルの統合による構音障害者の音声認識
【24h】

メタモデルと音響モデルの統合による構音障害者の音声認識

机译:融合元模型和声学模型的构音障碍语音识别

获取原文
获取原文并翻译 | 示例
       

摘要

音声認識技術は現在,様々な環境下や場面において使用される機会が増加している.しかし,言語障害者などの障害者を対象としたものは非常に少ない.本稿では,アテトーゼ型脳性マヒによる構音障害者の音声認識の検討を行う.アテトーゼ型の構音障害者の場合,最初の動作において緊張状態により,通常よりも発話が不安定になる場合がある.そこで,我々はPCA(Principal Component Analysis)による発話変動にロバストな特徴量抽出法を提案してきた.本稿では,さらなる改善として,各話者の音素毎の置換,挿入の傾向を音声認識の過程に組み込むことが可能なメタモデル(MetamOdel)との統合を試み,その有効性を示す.%Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of the first utterance tends to become unstable due to strain of a muscle and that causes degradation of speech recognition, where MFCC (Mel Frequency Cepstral Coefficients) is used as speech features. Therefore we proposed a robust feature extraction method based on PCA (Principal Component Analysis) instead of MFCC. In this paper, we discuss our effort to integrate a Metamodel and Acoustic model approach. Metamodel has a technique for incorporating a model of a speaker's confusion matrix into the ASR process in such a way as to increase recognition accuracy. Its effectiveness is confirmed by word recognition experiments.
机译:语音识别技术现在正越来越多地用于各种环境和情况。但是,针对残障人士(例如语言障碍者)的目标很少。在本文中,我们研究了由于动脉粥样硬化性脑瘫而导致构音障碍的人的语音识别。在无动脉粥样硬化性构音障碍的情况下,由于第一动作的张力,发声可能比平时更加​​不稳定。因此,我们提出了一种特征提取方法,该方法对于PCA(主成分分析)对语音波动具有鲁棒性。在本文中,作为进一步的改进,我们尝试与元模型(MetamOdel)集成,该模型可以将每个说话人的每个说话人的替换和插入趋势纳入语音识别过程中,并显示其有效性。 %最近,通过使用语音的随机建模显着提高了与说话者无关的语音识别的准确性,但是,对口语挑战者(例如有言语障碍的人)的研究很少,因此我们尝试建立具有发音障碍的人的声学模型。由于肌肉的拉力,第一次发声的发音趋于变得不稳定,并导致语音识别性能下降,其中MFCC(梅尔频率倒谱系数)被用作语音特征。提出了一种基于主成分分析(PCA)而不是MFCC的鲁棒特征提取方法。在本文中,我们讨论了将元模型和声学模型方法集成在一起的工作。元模型具有将说话者的混淆矩阵模型合并到模型中的技术。 ASR处理可以提高识别准确度,其有效性已通过单词识别实验得到证实。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号