首页> 外文期刊>電子情報通信学会技術研究報告 >Buried Markov Modelを用いた構音障害者の音声認識の検討
【24h】

Buried Markov Modelを用いた構音障害者の音声認識の検討

机译:基于埋藏马尔可夫模型的发音障碍者语音识别研究

获取原文
获取原文并翻译 | 示例
       

摘要

Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we consider temporal dependence to solve this problem. Though HMM makes it possible to recognize clear utterance with high accuracy, the speech including the noise or the continuous utterance causes degradation of speech recognition. To soJve this problem, J. Bilmes proposed buried Markov model which contains the conditional independence between the observation nodes. In this paper, we perform phone recognition experiments using buried Markov model.%音声認識技術は現在,様々な環境下や場面において使用される機会が増加している.しかし,言語障害などの障害者を対象としたものは非常に少ない.本稿では,アテトーゼ型脳性麻痔による構音障害者の音声認識の検討を行う.アテトーゼ型の構苦障害者の場合,筋肉の緊張のため発話が不安定になりやすい.これに対し,本研究では,時間変化による依存関係を考慮することで,不安定な発話に対する音声認識精度の改善を試みる.従来用いられているHMMによる音声認識は,はっきりと発話された音声に対しては高い精度で認識を行うことができるが,複雑な事象を表現するには適しておらず,雑音を含む音声や,連続的に発話された音声を認識する際には,精度が著しく低下する.この問題に対し,過去の観測と現在の観測の間の依存関係を表現できる確率モデルであるBuried Markov Modelを用いた音声認識モデルが,J.Bilmesによって提案された.本研究では,構書障害者の音声認識の実現に向けて,このBuried Markov Modelを用いて時間的依存関係を考慮し,音声認識精度の向上を目指す.
机译:近来,通过使用语音的随机建模,显着提高了与说话者无关的语音识别的准确性。但是,对口语挑战者(例如有语言障碍的人)的研究很少。因此,我们已经尝试为具有发音障碍的人建立声学模型。由于与语音相关的肌肉上的拉力,语音的发音趋于变得不稳定,并且这导致语音识别的劣化。因此,我们考虑时间依赖性来解决这个问题。尽管HMM可以高精度地识别清晰的语音,但是包括噪声或连续语音的语音会导致语音识别性能下降。为了解决这个问题,J。Bilmes提出了隐马尔可夫模型,该模型包含观测节点之间的条件独立性。本文中,我们使用隐马尔可夫模型进行了电话识别实验。%音声认识技术は现在,様々な环境下や事件において使用される机会が増加している。しかし,言语障害などの障害者を対象としたではのは非常に少ない。では,本研究では,时间変化による依存关系を考虑することで,不安定な発话に対する音声认识精度の改善を试みる。従来用いられているHMMによる音声认识は,はっきりと発话された音声に対しては高い精度で认识を行うことができるが,复雑な事象を表现するには适しておらず,雑音を含む音声や,连続的に発话された音声を认识する际には,精度が着しく低下こ。この问题に対し,过去の観测と现在の観测の间の依存关系を表现できる确实率モデルである埋入式马尔可夫模型を用いた音声认识认识デルが,J.Bilmesによって着によって书障害者の音声认识の実现に向けて,この埋入马尔可夫模型を用いて时间的依存关系を考虑し,音声认识精度の向上を目指す。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2010年第220期|p.69-74|共6页
  • 作者单位

    神戸大学工学研究科 〒657-8501 兵庫県神戸市灘区六甲台1-1;

    神戸大学工学研究科 〒657-8501 兵庫県神戸市灘区六甲台1-1;

    神戸大学工学研究科 〒657-8501 兵庫県神戸市灘区六甲台1-1;

    神戸大学工学研究科 〒657-8501 兵庫県神戸市灘区六甲台1-1;

    追手門学院大学経済学部 〒567-8502 大阪府茨木市西安威2-1-15;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    構書障害; buried markov model;

    机译:语法障碍;隐马尔可夫模型;
  • 入库时间 2022-08-18 00:33:54

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号