首页> 外国专利> Voice activity decision base on zero crossing rate and spectral sub-band energy

Voice activity decision base on zero crossing rate and spectral sub-band energy

机译:基于零交叉率和频谱子带能量的语音活动决策

摘要

A voice activity detection method and apparatus, and an electronic device are provided. The method includes: obtaining a time domain parameter and a frequency domain parameter from an audio frame; obtaining a first distance between the time domain parameter and a long-term-sliding mean of the time domain parameter in a history background noise frame, and obtaining a second distance between the frequency domain parameter and a long-term-sliding mean of the frequency domain parameter in the history background noise frame; and judging whether the audio frame is a foreground voice frame or a background noise frame according to the first distance, the second distance and a set of decision inequalities based on the first distance and the second distance. The above technical solutions enable the judgment criterion to have an adaptive adjustment capability, thus improving the performance of the voice activity detection.
机译:提供了一种语音活动检测方法和装置以及电子设备。该方法包括:从音频帧获得时域参数和频域参数;以及获得历史背景噪声帧中时域参数与时域参数的长期滑动均值之间的第一距离,以及获得频域参数与频率的长期滑动均值之间的第二距离历史背景噪声帧中的域参数;根据第一距离,第二距离和基于第一距离和第二距离的一组判定不等式,判断音频帧是前景语音帧还是背景噪声帧。上述技术方案使得判断准则具有自适应调整能力,从而提高了语音活动检测的性能。

著录项

  • 公开/公告号US8554547B2

    专利类型

  • 公开/公告日2013-10-08

    原文格式PDF

  • 申请/专利权人 ZHE WANG;

    申请/专利号US201213546572

  • 发明设计人 ZHE WANG;

    申请日2012-07-11

  • 分类号G10L21/02;G10L15/20;G10L17/00;

  • 国家 US

  • 入库时间 2022-08-21 16:43:36

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号