首页> 外文期刊>電子情報通信学会技術研究報告 >雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用
【24h】

雑音残響環境下での変調伝達関数に基づくパワーエンベロープ回復処理と音声認識への応用

机译:噪声回响环境中基于调制传递函数的功率包络恢复处理及其在语音识别中的应用

获取原文
获取原文并翻译 | 示例
           

摘要

著者らは,これまでに,雑書残響音声から変調伝達関数(MTF)に基づくパワーエンベロープ回復法を提案してきた.提案法は,室内音響のインパルス応答や雑音レベルの事前測定を行わずに,雑書残響音声のパワーエンベロープを回復できる.本稿では,雑音残響環境下において提案法を音声認識システムの前処理として適用することで,雑音残響によって低減した音声認識率をどれだけ回復できるか調査した.雑書残響音声信号は,クリーンな音声信号(AURORA-2J)と室内インパルス応答を畳み込み,背景雑音として白色雑音を加算することで生成された.雑音残響環境下でのパワーエンベロープ回復をSNRとCorr(誤差と類似性)で評価した結果,全ての条件でパワーエンベロープを回復できた.音声認識評価では,代表的なMFCCを音声認識の比較基準として評価に利用した.雑書残響環境下での定量的評価の結果,MFCCと比較して提案法は,8.33%音声認識率を向上させることができた.%We previously proposed a method for restoring the speech power envelope from noisy reverberant speech based on a simple modulation transfer function (MTF) concept. The method does not require the impulse response and noise conditions of the room acoustics to be measured. In this study, we further tested the proposed method as a front-end for ASR systems in noisy reverberant environments. Noisy reverberant speech signals were obtained by adding white noise to reverberant speech produced by convoluting clean speech signals (from the AURORA-2J database) with artificially made impulse response of room acoustics. The recognition performance based on the conventional Mel frequency cepstral coefficient (MFCC) feature was used as a baseline. Compared with the baseline, the proposed method obtained 8.33 % relative improvement in the error reduction rate.
机译:作者从杂书的回声中提出了一种基于调制传递函数(MTF)的功率包络恢复方法。所提出的方法可以恢复杂书的混响声音的功率包络,而无需预先执行室内声音的脉冲响应和噪声水平。在本文中,我们研究了通过将所提出的方法用作在嘈杂混响环境下的语音识别系统的预处理,可以将噪声混响降低的语音识别率恢复多少。通过将纯净语音信号(AURORA-2J)和室内脉冲响应进行卷积并添加白噪声作为背景噪声来生成杂书混响语音信号。通过SNR和Corr(误差和相似度)评估在噪声混响环境下的功率包络恢复,并在所有条件下恢复功率包络。在语音识别评估中,使用典型的MFCC作为语音识别的比较标准进行评估。混响环境下的定量评估结果表明,与MFCC相比,该方法能够将语音识别率提高8.33%。我们先前提出了一种基于简单调制传递函数(MTF)概念的从嘈杂混响语音中恢复语音功率包络的方法,该方法不需要测量室内声学的脉冲响应和噪声条件。我们进一步测试了该方法在嘈杂混响环境中作为ASR系统的前端的方法。通过将白噪声人工合成卷积清晰语音信号(来自AURORA-2J数据库)而产生的混响语音中添加了白噪声,从而获得了嘈杂混响语音信号。以传统的梅尔频率倒谱系数(MFCC)为特征的识别性能作为基线,与基线相比,该方法的误码减少率相对提高了8.33%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号