本研究では,多峰的な分布に従う非定常雑音のモデルをオンライン推定して雑音抑圧に利用することにより,強い非定常性を持つ雑音環境下での音声認識性能が大幅に改善することを示す.従来のVector Taylor series (VTS)等に代表される雑音抑圧法では,雑音のモデルに単一性のガウス分布を適用していたが,実世界で観測される雑音の多くは多峰的な分布に従っているため,雑音のモデル化が十分でなかった.提案手法では,雑音信号を観測信号から最小平均二乗誤差(MMSE:Minimum mean squared error)推定し,得られた雑音信号を学習データとして利用することにより,多峰的な分布を持つ雑音のオンラインでのモデル化を容易にした.提案手法により,従来のVTS 法に比べて最大12%の音声認識性能を改善することができた.
展开▼