メタモデルと音響モデルの統合による構音障害者の音声認識

松政　宏典; 滝口　哲也; 有木　康雄; 李　義昭; 中林　稔堯

首页> 外文期刊>電子情報通信学会技術研究報告 >メタモデルと音響モデルの統合による構音障害者の音声認識

【24h】

メタモデルと音響モデルの統合による構音障害者の音声認識

机译：融合元模型和声学模型的构音障碍语音识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

音声認識技術は現在，様々な環境下や場面において使用される機会が増加している．しかし，言語障害者などの障害者を対象としたものは非常に少ない．本稿では，アテトーゼ型脳性マヒによる構音障害者の音声認識の検討を行う．アテトーゼ型の構音障害者の場合，最初の動作において緊張状態により，通常よりも発話が不安定になる場合がある．そこで，我々はPCA（Principal Component Analysis）による発話変動にロバストな特徴量抽出法を提案してきた．本稿では，さらなる改善として，各話者の音素毎の置換，挿入の傾向を音声認識の過程に組み込むことが可能なメタモデル（MetamOdel）との統合を試み，その有効性を示す．%Recently, the accuracy of speaker-independent speech recognition has been remarkably improved by use of stochastic modeling of speech. However, there has been very little research on orally-challenged people, such as those with speech impediments. Therefore we have tried to build the acoustic model for a person with articulation disorders. The articulation of the first utterance tends to become unstable due to strain of a muscle and that causes degradation of speech recognition, where MFCC (Mel Frequency Cepstral Coefficients) is used as speech features. Therefore we proposed a robust feature extraction method based on PCA (Principal Component Analysis) instead of MFCC. In this paper, we discuss our effort to integrate a Metamodel and Acoustic model approach. Metamodel has a technique for incorporating a model of a speaker's confusion matrix into the ASR process in such a way as to increase recognition accuracy. Its effectiveness is confirmed by word recognition experiments.

机译：语音识别技术现在正越来越多地用于各种环境和情况。但是，针对残障人士（例如语言障碍者）的目标很少。在本文中，我们研究了由于动脉粥样硬化性脑瘫而导致构音障碍的人的语音识别。在无动脉粥样硬化性构音障碍的情况下，由于第一动作的张力，发声可能比平时更加不稳定。因此，我们提出了一种特征提取方法，该方法对于PCA（主成分分析）对语音波动具有鲁棒性。在本文中，作为进一步的改进，我们尝试与元模型（MetamOdel）集成，该模型可以将每个说话人的每个说话人的替换和插入趋势纳入语音识别过程中，并显示其有效性。％最近，通过使用语音的随机建模显着提高了与说话者无关的语音识别的准确性，但是，对口语挑战者（例如有言语障碍的人）的研究很少，因此我们尝试建立具有发音障碍的人的声学模型。由于肌肉的拉力，第一次发声的发音趋于变得不稳定，并导致语音识别性能下降，其中MFCC（梅尔频率倒谱系数）被用作语音特征。提出了一种基于主成分分析（PCA）而不是MFCC的鲁棒特征提取方法。在本文中，我们讨论了将元模型和声学模型方法集成在一起的工作。元模型具有将说话者的混淆矩阵模型合并到模型中的技术。 ASR处理可以提高识别准确度，其有效性已通过单词识别实验得到证实。

著录项

来源
《電子情報通信学会技術研究報告》 |2008年第66期|p.37-42|共6页
作者
松政　宏典; 滝口　哲也; 有木　康雄; 李　義昭; 中林　稔堯;
展开▼
作者单位

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台町1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台町1-1;

神戸大学工学研究科　〒657-8501　兵庫県神戸市灘区六甲台町1-1;

追手門学院大学経済学部　〒567-8502　大阪府茨木市西安威2-1-15;

神戸大学発達科学部　〒657-8501　兵庫県神戸市鶴甲3-11;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
構音障害; 言語障害; 脳性マヒ;

机译：口齿障碍;言语障碍;脑瘫;
入库时间 2022-08-18 00:37:23

相似文献

外文文献
中文文献
专利

1. メタモデルと音響モデルの統合による構音障害者の音声認識 [J] . 松政宏典, 滝口哲也, 有木康雄, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第66期

机译：通过整合元模型和声学模型对发音能力障碍者进行语音识别
2. メタモデルと音響モデルの統合による構音障害者の音声認識 [J] . 松政宏典, 滝口哲也, 有木康雄, 電子情報通信学会技術研究報告. 福祉情報工学. Welfare Information Technology . 2008,第67期

机译：通过整合元模型和声学模型对发音能力障碍者进行语音识别
3. メタモデルと音響モデルの統合による構音障害者の音声認識 [J] . 松政　宏典, 滝口　哲也, 有木　康雄, 電子情報通信学会技術研究報告 . 2008,第67期

机译：融合元模型和声学模型的构音障碍语音识别
4. デジタル打音検査とAI・シミュレーションの統合的活用によるコンクリート内部構造診断の実現（2）シミュレーションモデル開発とAI順解析による大規模DB化 [C] . 松永嵩, 小川良太, 匂坂充行, 土木学会;土木学会全国大会年次学術講演会 . -1

机译：通过模拟模型开发和AI订单分析实现数字击中检验和AI和仿真（2）大规模DB的综合利用具体内部结构诊断
5. メディアデータを対象としたメタデータ抽出作用素とその逆作用素による知識創造サイクルモデル [D] . 岡田龍太郎, /オカダリョウタロウ 2019

机译：媒体数据元数据提取算子及其逆算子的知识创造周期模型
6. 障害児を育てる家族に対する看護実践モデル構築を目指した質的研究の統合 : 家族のノーマリゼーションを視点としたメタ研究による体系化 [O] . 佐藤奈保 2005

机译：定性研究的整合，旨在构建抚养残疾儿童家庭的护理实践模型：从家庭正常化的角度通过元研究进行系统化

メタモデルと音響モデルの統合による構音障害者の音声認識

摘要

著录项

相似文献

相关主题

期刊订阅