首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >回帰木に基づく複数の変換行列を用いた特徴量空間の適応法
【24h】

回帰木に基づく複数の変換行列を用いた特徴量空間の適応法

机译:回帰木に基づく複数の変換行列を用いた特徴量空間の適応法

获取原文
获取原文并翻译 | 示例
       

摘要

特徴量空間での話者適応(fMLLR)は,特徴量ベクトル系列に単一の変換行列を乗算することで実現される.このためfMLLRはデコーディング処理とは独立な,特徴量に関する前処理として実装でき,ガウス混合分布(GMM)と同様にディープ·ニューラルネットワーク(DNN)の音響モデルに対しても適用できる.一方,モデル空間の適応では回帰木に基づく複数の変換行列を用いることで,単一の変換行列を用いるfMLLRよりも高い精度で適応が可能である.しかしこの手法はGMMでの適応に特化しており,GMMでないDNNの音響モデルには適用できないという課題があった.本報では,fMLLRにおける1パスの状態アラインメント情報を用いてフレーム毎に対応する榎数の変換行列を対応づけ,それらを用いて事後確率もしくはGMMの混合重みによる重み付け線形和で表現される変換行列で特徴量変換を行う手法を提案する.実験結果から,提案法は従来の単一の変換行列を用いるfMLLRよりもGMMとDNN双方の音響モデルで単語誤り率を改善し,またモデル適応の場合と同程度の性能を実現できることがわかった.

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号