...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用
【24h】

雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用

机译:噪声混响环境中基于调制传递函数的功率包络恢复处理及其在语音识别中的应用

获取原文
获取原文并翻译 | 示例

摘要

著者らは,これまでに,雑音残響音声から変調伝達関数(MTF)に基づくパワーエンベロープ回復法を提案してきた.提案法は,室内音響のインパルス応答や雑音レベルの事前測定を行わずに,雑音残響音声のパワーエンベロープを回復できる.本稿では,雑音残響環境下において提案法を音声認識システムの前処理として適用することで,雑音残響によって低減した音声認識率をどれだけ回復できるか調査した.雑音残響音声信号は,クリーンな音声信号(AURORA-2J)と室内インパルス応答を畳み込み,背景雑音として白色雑音を加算することで生成された.雑音残響環境下でのパワーエンベロープ回復をSNRとCorr(誤差と類似性)で評価した結果,全ての条件でパワーエンベロープを回復できた.音声認識評価では,代表的なMFCCを音声認識の比較基準として評価に利用した.雑音残響環境下での定量的評価の結果,MFCCと比較して提案法は,8.33%音声認識率を向上させることができた.
机译:作者从噪声混响语音中提出了一种基于调制传递函数(MTF)的功率包络恢复方法。所提出的方法可以恢复噪声混响的功率包络,而无需预先测量室内声脉冲响应或噪声水平。在本文中,我们研究了通过将所提出的方法作为噪声混响环境中的语音识别系统的预处理,可以将噪声混响降低的语音识别率恢复多少。噪声混响音频信号是通过将干净的音频信号(AURORA-2J)和房间脉冲响应进行卷积并添加白噪声作为背景噪声而生成的。通过SNR和Corr(误差和相似度)评估噪声混响环境下的功率包络恢复,可以在所有条件下恢复功率包络。在语音识别评估中,使用典型的MFCC作为语音识别的比较标准进行评估。通过在嘈杂的混响环境中进行定量评估,与MFCC相比,该方法能够将语音识别率提高8.33%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号