...
【24h】

音声認識のための非線形スペクトル変換を用いた話者適応

机译:带有非线性频谱变换的说话人自适应语音识别

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

音声認識では,モデル学習で使用した話者に対して音声の特徴が大きく外れている話者の認識精度が低下してしまう問題がある.この問題を解決するため,MLLR等の話者適応手法が用いられている.MLLR法では,回帰行列を少量の適応データから学習し,モデルパラメータを線形変換して適応を行う.このとき回帰行列はHMMの状態を分類した回帰クラス毎に与えられるが,各状態に対しては線形な変換しか表現できなかった.そこで本研究では,非線形な変換が可能なGMMに基づくスペクトル変換法を話者適応に用いることを提案する.提案法ではスペクトル変換用のGMMと認識用のHMMを統合した新しい尤度関数を定義し,尤度最大化基準により話者適応を行う.音素認識実験の結果,その有効性を確認した.
机译:在语音识别中,存在语音特性与模型学习中使用的说话者的语音特性明显不同的说话者的识别精度降低的问题。为了解决这个问题,使用了诸如MLLR之类的说话者自适应方法。在MLLR方法中,从少量的自适应数据中学习回归矩阵,并对模型参数进行线性变换以进行自适应。这时,为分类HMM状态的每个回归类别提供了回归矩阵,但每个状态只能表示线性变换。因此,在这项研究中,我们建议使用能够进行非线性转换以实现说话人自适应的基于GMM的频谱转换方法。在提出的方法中,定义了一种新的似然函数,该函数集成了用于频谱转换的GMM和用于识别的HMM,并根据似然最大化标准对说话者进行了调整。作为语音识别实验的结果,证实了其有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号