雑音に頑健な音韻モデルと教師なし話者適応

山出慎吾; 李晃伸; 猿渡洋鹿野清宏Shingo YamadeAkinobu LeeHiroshi SaruwatariKiyohiro Shikano

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >雑音に頑健な音韻モデルと教師なし話者適応

【24h】

雑音に頑健な音韻モデルと教師なし話者適応

机译：雑音に頑健な音韻モデルと教師なし話者適応

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

実環境において頑健に音声認識を行うためには，音韻モデルを環境や話者に対して適応させることが重要である．特に実用化を考慮した場合，環境雑音の変動や話者の交代に迅速に対応できることが必要となる．本稿では，まず雑音下の入力音声に対しスペクトルサブトラクションを施した後，任意の小量の雑音を重畳することにより，雑音雑音の影響を低減するアルゴリズムを提案する．さらに，提案手法を十分統計量に基づく教師なし話者適応アルゴリズムに適用する．従来は対象とする環境ごとに音声データベースに雑音を重畳して十分統計量を計算する必要があったが，提案手法では各雑音の種類やSNRの変化をスペクトルサブトラクションおよび雑音の重畳により打ち消すため十分統計量を再計算する必要がなく，どのような環境においても任意の一発声文で，高速に音韻モデルの教師なし話者適応が行える．提案法をオフィス，車内，展示会場，人混みの4種類の環境において，2万語のディクテーションタスクで認識実験を行ったところ，提案手法により適応した音韻モデルの平均認識率は，雑音環境ごとにマッチさせた従来の環境·話者適応モデルと比較してほぼ同程度の認識性能を示し，さらに雑音の変動に対する頑健性が示された．さらに教師あり適応であるMLLR法との比較も報告する．

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2002年第529期|19-24|共6页
作者
山出慎吾; 李晃伸; 猿渡洋鹿野清宏Shingo YamadeAkinobu LeeHiroshi SaruwatariKiyohiro Shikano;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种日语
中图分类电报、传真;
关键词
耐雑音音声認識; 話者適応; スペクトルサブトラクション; 十分統計量; Noise robust speech recognition; Speaker adaptation; Spectral subtraction; HMM sufficient statistics;

雑音に頑健な音韻モデルと教師なし話者適応

摘要

著录项

相关主题

期刊订阅