...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >雑音に頑健な音韻モデルと教師なし話者適応
【24h】

雑音に頑健な音韻モデルと教師なし話者適応

机译:雑音に頑健な音韻モデルと教師なし話者適応

获取原文
获取原文并翻译 | 示例
           

摘要

実環境において頑健に音声認識を行うためには,音韻モデルを環境や話者に対して適応させることが重要である.特に実用化を考慮した場合,環境雑音の変動や話者の交代に迅速に対応できることが必要となる.本稿では,まず雑音下の入力音声に対しスペクトルサブトラクションを施した後,任意の小量の雑音を重畳することにより,雑音雑音の影響を低減するアルゴリズムを提案する.さらに,提案手法を十分統計量に基づく教師なし話者適応アルゴリズムに適用する.従来は対象とする環境ごとに音声データベースに雑音を重畳して十分統計量を計算する必要があったが,提案手法では各雑音の種類やSNRの変化をスペクトルサブトラクションおよび雑音の重畳により打ち消すため十分統計量を再計算する必要がなく,どのような環境においても任意の一発声文で,高速に音韻モデルの教師なし話者適応が行える.提案法をオフィス,車内,展示会場,人混みの4種類の環境において,2万語のディクテーションタスクで認識実験を行ったところ,提案手法により適応した音韻モデルの平均認識率は,雑音環境ごとにマッチさせた従来の環境·話者適応モデルと比較してほぼ同程度の認識性能を示し,さらに雑音の変動に対する頑健性が示された.さらに教師あり適応であるMLLR法との比較も報告する.
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号