Buried Markov Modelを用いた構音障害者の音声認識の検討

宮本　千琴; 駒井　祐人; 滝口　哲也; 有木　康雄; 李　義昭

首页> 外文期刊>電子情報通信学会技術研究報告 >Buried Markov Modelを用いた構音障害者の音声認識の検討

【24h】

Buried Markov Modelを用いた構音障害者の音声認識の検討

机译：基于埋藏马尔可夫模型的发音障碍者语音识别研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of speech tends to become unstable due to strain on speech-related muscles, and that causes degradation of speech recognition. Therefore, we consider temporal dependence to solve this problem. Though HMM makes it possible to recognize clear utterance with high accuracy, the speech including the noise or the continuous utterance causes degradation of speech recognition. To soJve this problem, J. Bilmes proposed buried Markov model which contains the conditional independence between the observation nodes. In this paper, we perform phone recognition experiments using buried Markov model.%音声認識技術は現在，様々な環境下や場面において使用される機会が増加している.しかし，言語障害などの障害者を対象としたものは非常に少ない.本稿では，アテトーゼ型脳性麻痔による構音障害者の音声認識の検討を行う.アテトーゼ型の構苦障害者の場合，筋肉の緊張のため発話が不安定になりやすい.これに対し，本研究では，時間変化による依存関係を考慮することで，不安定な発話に対する音声認識精度の改善を試みる.従来用いられているHMMによる音声認識は，はっきりと発話された音声に対しては高い精度で認識を行うことができるが，複雑な事象を表現するには適しておらず，雑音を含む音声や，連続的に発話された音声を認識する際には，精度が著しく低下する.この問題に対し，過去の観測と現在の観測の間の依存関係を表現できる確率モデルであるBuried Markov Modelを用いた音声認識モデルが，J.Bilmesによって提案された.本研究では，構書障害者の音声認識の実現に向けて，このBuried Markov Modelを用いて時間的依存関係を考慮し，音声認識精度の向上を目指す.

机译：近来，通过使用语音的随机建模，显着提高了与说话者无关的语音识别的准确性。但是，对口语挑战者（例如有语言障碍的人）的研究很少。因此，我们已经尝试为具有发音障碍的人建立声学模型。由于与语音相关的肌肉上的拉力，语音的发音趋于变得不稳定，并且这导致语音识别的劣化。因此，我们考虑时间依赖性来解决这个问题。尽管HMM可以高精度地识别清晰的语音，但是包括噪声或连续语音的语音会导致语音识别性能下降。为了解决这个问题，J。Bilmes提出了隐马尔可夫模型，该模型包含观测节点之间的条件独立性。本文中，我们使用隐马尔可夫模型进行了电话识别实验。％音声认识技术は现在，様々な环境下や事件において使用される机会が増加している。しかし，言语障害などの障害者を対象としたではのは非常に少ない。では，本研究では，时间変化による依存关系を考虑することで，不安定な発话に対する音声认识精度の改善を试みる。従来用いられているHMMによる音声认识は，はっきりと発话された音声に対しては高い精度で认识を行うことができるが，复雑な事象を表现するには适しておらず，雑音を含む音声や，连続的に発话された音声を认识する际には，精度が着しく低下こ。この问题に対し，过去の観测と现在の観测の间の依存关系を表现できる确实率モデルである埋入式马尔可夫模型を用いた音声认识认识デルが，J.Bilmesによって着によって书障害者の音声认识の実现に向けて，この埋入马尔可夫模型を用いて时间的依存关系を考虑し，音声认识精度の向上を目指す。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第220期|p.69-74|共6页
作者
宮本　千琴; 駒井　祐人; 滝口　哲也; 有木　康雄; 李　義昭;
展开▼
作者单位

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台1-1;

追手門学院大学経済学部　〒567-8502　大阪府茨木市西安威2-1-15;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
構書障害; buried markov model;

机译：语法障碍;隐马尔可夫模型;
入库时间 2022-08-18 00:33:54

相似文献

外文文献
中文文献
专利

1. Buried Markov Modelを用いた構音障害者の音声認識の検討 [J] . 宮本千琴, 駒井祐人, 滝口哲也, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第220期

机译：使用埋藏式马尔可夫模型对发音障碍患者的语音识别进行检查
2. Buried Markov Modelを用いた構音障害者の音声認識の検討 [J] . 宮本　千琴, 駒井　祐人, 滝口　哲也, 電子情報通信学会技術研究報告 . 2010,第219期

机译：基于埋藏马尔可夫模型的发音障碍者语音识别研究
3. Buried Markov Modelを用いた構音障害者の音声認識の検討 [J] . 宮本千琴, 駒井祐人, 滝口哲也, 電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2010,第219期

机译：使用埋藏式马尔可夫模型对发音障碍患者的语音识别进行检查
4. Hybrid CTC/attention モデルを用いた構音障害者音声認識の検討 [C] . 澤佑哉, 高島遼一, 滝口哲也, 日本音響学会;日本音響学会研究発表会 . 2020

机译：用杂种CTC /注意模型检查堵塞静脉紊乱的语音识别
5. 日本人の自然発話を対象とした音声感情認識 -感情音声の訓練サンプル数最適化を用いて- [D] . 市川朋輝 2020

机译：日本自然语音的语音情感识别-利用情感语音训练样本的优化-
6. 脊髄小脳変性症(SCA6)による失調性構音障害患者における交互反復運動速度低下要因の検討 : 動作解析を用いた口唇運動の分析 [O] . Motion analysis study of decreased alternating motion rates in persons with ataxic dysarthria小澤由嗣, 鈴木知詩, 石崎文子 2008

机译：检查因脊髓小脑退化引起的共济失调性构音障碍患者的交替重复减速因素（sCa6）：使用运动分析分析唇部运动

Buried Markov Modelを用いた構音障害者の音声認識の検討

摘要

著录项

相似文献

相关主题

期刊订阅