首页> 外文期刊>電子情報通信学会技術研究報告 >経験的モード分解と変調スぺクトル分析を用いた音声区間検出の耐性向上に関する検討
【24h】

経験的モード分解と変調スぺクトル分析を用いた音声区間検出の耐性向上に関する検討

机译:基于经验模态分解和调制谱分析的语音区间检测抗性研究

获取原文
获取原文并翻译 | 示例
       

摘要

Voice activity detection (VAD) is used to detect speechon-speech periods in observed signals. However, current VAD technique has a serious problem in that the accuracy of detection of speech periods drastically reduces if it is used for noisy speech and/or for mixtures of speechon-speech. We proposed a robust VAD using empirical mode decomposition (EMD) and modulation spectrum analysis (MSA) to resolve these problems (method A). EMD is used to decompose the observed signals into intrinsic mode functions (IMFs). Then, speechon-speech periods are determined from resynthesize non-stationary IMFs by using MSA. Method A detected speech periods more correctly than conventional method. However, Fales detection was not able to be lost completely. This paper examined the techniques that raise robustness of method A. We proposed VAD that is detected from each IMFs by MSA(method B). As a result of evaluation, method B was able to do VAD which was more exact and stabilize (detection accuracy is not influenced by an analysis signal) than the method A. It has checked that robustness was improving.%音声区間検出(VAD)は,観測信号の音声/非音声区間を検出する技術である.しかし,現在のVAD技術には,目的音声以外に背景雑音や非音声信号が混在する環境では,検出精度が著しく低下するという重大な問題がある.これまでに著者らは,この問題を解決するため,観測信号を経験的モード分解により固有モード関数(IMF) に分解し,その後,非定常成分のIMFから再合成した信号に対して変調スぺクトル分析を行うVAD法の提案を行つた(提案法A).提案法Aは背景雑音や非音声信号の存在する環境で,従来法より優れた精度で音声区間を検出できたが,誤受理率や誤棄却率を完全には無くせなかった.本論文では,提案法Aの耐性を向上させる手段を検討した.その結果,非定常なIMFを再合成せず,各IMFから音声区間を検出する手法を提案する(提案法B).評価の結果,非定常な背景雑音がある環境で,提案法Bは提案法Aより正確かつ信号の種類に検出精度の左右されない音声区間検出を行うことができ,耐性が向上していることを確認できた.
机译:语音活动检测(VAD)用于检测观察到的信号中的语音/非语音时段。但是,当前的VAD技术具有严重的问题,即如果将其用于嘈杂的语音和/或用于语音/非语音的混合,则语音时段的检测精度会大大降低。我们提出了一种使用经验模式分解(EMD)和调制频谱分析(MSA)的鲁棒VAD来解决这些问题(方法A)。 EMD用于将观察到的信号分解为固有模式函数(IMF)。然后,通过使用MSA从重新合成的非平稳IMF确定语音/非语音周期。与传统方法相比,方法A更正确地检测了语音周期。但是,Fales检测并不能完全丢失。本文研究了提高方法A鲁棒性的技术。我们提出了通过MSA(方法B)从每个IMF中检测到的VAD。评估的结果是,方法B能够执行比方法A更精确和稳定的VAD(检测精度不受分析信号的影响)。它检查了鲁棒性是否在提高。%音声区间検出(VAD)しかし,観测信号の音声/非音声区间を検出する技术である。しかし,现在のVAD技术には,目的音声以外に背景雑音や非音声信号が混在する环境では,検出精度が着しく低下するという重大な问题がある。これまでに著者らは,この问题を解决するため,観测信号を経験的モード分解により固有モード关数(IMF)に分解し,その后,非定常常のIMFから再合成した信号に対して変调スぺクトル分析を行うVAD法の导入を行つた(进行法A)。进行法Aは背景雑音や非音声信号の存在する环境で,従来法より优れた精度れた音で区间を検出できでは,误删率や误弃却率を完全には无くせなかった。本论文では,实行法Aの耐性を向上させる手段を検讨した。その结果,非定常なIMFを再合成せず,各IMF価音声区间を検出を検手法を进行する(前进法B)。评価の结果,非定常な背景雑音がある环境で,逐步法はは法Aより正确かつ信号の种类に検出精度の左右されない音声区间検出を行うことができ,耐性が向上していることを确认できた。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号