首页> 外文期刊>電子情報通信学会技術研究報告. 応用音響. Engineering Acoustics >利用環境変動に頑健な分岐選択型DNN音響モデルの検討
【24h】

利用環境変動に頑健な分岐選択型DNN音響モデルの検討

机译:利用環境変動に頑健な分岐選択型DNN音響モデルの検討

获取原文
获取原文并翻译 | 示例
       

摘要

近年Deep Neural Network(DNN)の応用により,音声認識技術が様々な場面で利用されている.しかしながら音声認識システムにおいて高精度な認識結果を得るためには利用する環境ごとに対応した音響モデルを用意しなければならない.各音響モデルの学習にはそれぞれの利用環境に応じた大量の学習データと計算時間を必要とするため非常にコストがかかる.この問題に対して1つの音響モデルで複数の利用環境に対応するために複数の利用環境の音声を合わせて学習する方法が挙げられる.しかし,複数の利用環境の音声を合わせてDNNを学習する場合,DNNが音素などのシンボルの識別を行なうときに利用環境間の音声が互いに惑影響を及ぼす可能性がある.そこで本研究では利用する環境の違いに頑健な音響モデルの学習方法を提案する.具体的には,DNNの入力層を利用環境の数だけ分岐させ,出力層あるいは中間層で分岐を結合することで,各分岐が利用環境ごとに学習できるようなDNN音響モデルを構築する.この音響モデルを用いることで,分岐しないDNNと比べて文字正解精度の相対誤り改善率は9.6となり,提案するDNN音響モデルの有効性を示した.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号