首页> 外文期刊>電子情報通信学会技術研究報告 >変調伝達関数に基づいたパヮーエンベロープ回復処理における音声区間検出の検討
【24h】

変調伝達関数に基づいたパヮーエンベロープ回復処理における音声区間検出の検討

机译:基于调制传递函数的功率包络恢复处理中的语音段检测研究

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

This paper reports comparative evaluations of conventional voice activity detection (VAD) methods in reverberant environments. Both conventional (thresholding) and standard (G.729 and AMR) methods are discussed. In general, these methods work well under clean conditions, but their performance is drastically affected by reverberation. Preliminary comparative evaluations showed that the false acceptance rate (FAR) is significantly increased due to the false rejection rate (FRR) being moderately increased by reverberation. We therefore developed a method using MTF-based power envelope restoration to improve the robustness of VAD in reverberant environments. This restoration method can blindly restore the power envelope of reverberant speech based on the MTF concept. The proposed method consists of an MTF-based restoration method as the front end and a conventional VAD method as the final decision. Experimental results demonstrated that the proposed method is superior to conventional methods with regard to robustness and providing accurate VAD (reducing both FAR and FRR) in reverberant environments.%本論文では,はじめに,残響環境における代表的な音声区間検出(VAD)法の頑健性について検討した.ここでは,信号パワーに関する閾値処理,ならびにG.729B法とAMR法について比較検討した.その結果,これらの方法は,静音環境でうまく機能するが,残響環境ではその性能が著しく低下することがわかった.特に,残響の影響により,誤受理率(FAR)が誤棄却率(FRR)よりも著しく増加することがわかった.本論文では.これらの問題点を解決するために,パワーエンベロープ回復処理を利用したVAD法を提案した.この方法は,変調伝達関数に基づいた残響音声のパワーエンベロープをブラインド回復するものである.提案法は,前段にパワーエンベロープ回復法,後段に簡便なVAD法をとる2段処理で構成される.総合評価を行った結果,残響環境における頑健性に関して,提案法が代表的な方法よりも有効であり,音声•非音声区間を正確に検出できる(FARとFRRの減少)ことがわかった.
机译:本文报告了在混响环境中常规语音活动检测(VAD)方法的比较评估。讨论了常规(阈值)和标准(G.729和AMR)方法。通常,这些方法在干净的条件下效果很好,但混响会严重影响其性能。初步的比较评估表明,由于混响使假拒绝率(FRR)适度增加,因此假接受率(FAR)显着增加。因此,我们开发了一种使用基于MTF的功率包络恢复的方法来提高VAD在混响环境中的鲁棒性。这种恢复方法可以基于MTF概念盲目恢复混响语音的功率包络。所提出的方法包括基于MTF的还原方法作为前端,以及常规的VAD方法作为最终决策。实验结果表明,该方法在混响环境下的鲁棒性优于常规方法,并在混响环境中提供了准确的VAD(降低FAR和FRR)。%本论文では,では,残响环境における代表的な音声区间検出(VAD)法の顽健性について検探した。ここでは,信号パワーに关する阈値处理,ならびにG.729B法とAMR法について比较検探した。その结果,これらの方法は,静音环境でうまく机能するが,残响环境ではその性能が着しく低下することがわかった。特に,残响の影响により,误抄率(FAR)が误弃却率(FRR)よりも着しく増加することがわかった。本论文では。これらの问题点を解决こ,パワーエンベロープ回复处理を利用したVAD法を进行した。この方法は,変调伝达关数に基づいた残响音声のパワーエンエロープをブラインド回复ドのである。 ,后段に适合なVAD法をとる2段处理で构成される。総合评価を行った结果,残响环境における顽健性に关して,逐步法が代表的な方法よりも有效であり,音声•非音声区间を正确に検出できる(FARとFRRの减少)ことがわかった。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号