首页> 外文期刊>電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding >構音障害者音声認識のための混合正規分布に基づく音素ラベリングの検討
【24h】

構音障害者音声認識のための混合正規分布に基づく音素ラベリングの検討

机译:基于混合正态分布的语音标记检查,用于对发音障碍患者的语音识别

获取原文
获取原文并翻译 | 示例
           

摘要

本報告では,アテトーゼ型脳性麻痺による構音障害者の音声認識の検討を行う.従来研究として,畳み込みニューラルネットワークを用いた特徴量抽出法が提案され,その有効性が示されてきた.ニューラルネットワークの学習には教師信号としてHMMによる強制アライメントの結果が用いられているが,構音障害者の音声は発話毎にスペクトルの変動が大きいため,正確なアライメントを取ることは極めて難しい.誤った教師信号ではネットワークは十分に学習できないと考えられるため,上述の手法はその性能を十分に発揮できていないと考えられる.しかし,構音障害音声の音素境界は,健常者に比べて非常に曖昧であり,正確な音素境界を与えることは根本的に難しい.本研究では,音素ラベルを正規分布を用いた確率表現で与えることにより,構音障害音声特有の音素境界の曖昧性を考慮したラベリングを新たに提案する.本稿では,提案手法より得られる音素ラベルを教師信号としてネットワークを学習し,そのネットワークから抽出された特徴量を用いた単語認識実験の結果を報告する.
机译:在这份报告中,我们检查了由于晕厥型脑瘫而患有关节疾病的人的语音识别。作为常规研究,提出了使用卷积神经网络的特征量提取方法,并证明了其有效性。 HMM强制对齐的结果被用作学习神经网络的教师信号,但由于发音异常的人的语音频谱随每个语音而有很大的波动,因此很难获得精确的对齐。由于认为不能利用错误的教师信号来充分学习网络,因此认为上述方法不能充分证明其性能。然而,发音障碍语音的语音边界比健康受试者的语音边界要模糊得多,从根本上讲,很难给出准确的语音边界。在这项研究中,我们提出了一种新标签,该标签考虑了发音障碍性语音特有的语音边界的歧义,方法是使用正态分布将语音标签作为随机表达。在本文中,我们使用通过该方法获得的语音标签作为教师信号来学习网络,并使用从网络中提取的特征来报告单词识别实验的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号