首页> 外国专利> Voice activity decision base on zero crossing rate and spectral sub-band energy

Voice activity decision base on zero crossing rate and spectral sub-band energy

机译:基于零交叉率和频谱子带能量的语音活动决策

摘要

A voice activity detection method and apparatus, and an electronic device are provided. The method includes: obtaining a time domain parameter and a frequency domain parameter from an audio frame; obtaining a first distance between the time domain parameter and a long-term sliding mean of the time domain parameter in a history background noise frame, and obtaining a second distance between the frequency domain parameter and a long-term sliding mean of the frequency domain parameter in the history background noise frame; and judging whether the audio frame is a foreground voice frame or a background noise frame according to the first distance, the second distance and a set of decision inequalities based on the first distance and the second distance. The above technical solutions enable the judgment criterion to have an adaptive adjustment capability, thus improving the performance of the voice activity detection.
机译:提供了一种语音活动检测方法和装置以及电子设备。该方法包括:从音频帧获得时域参数和频域参数;以及获取历史背景噪声帧中时域参数与时域参数的长期滑动平均值之间的第一距离,并获得频域参数与频域参数的长期滑动平均值之间的第二距离在历史背景噪声帧中;根据第一距离,第二距离和基于第一距离和第二距离的一组判定不等式,判断音频帧是前景语音帧还是背景噪声帧。上述技术方案使得判断准则具有自适应调整能力,从而提高了语音活动检测的性能。

著录项

  • 公开/公告号US8296133B2

    专利类型

  • 公开/公告日2012-10-23

    原文格式PDF

  • 申请/专利权人 ZHE WANG;

    申请/专利号US201113307683

  • 发明设计人 ZHE WANG;

    申请日2011-11-30

  • 分类号G10L11/06;G10L21/02;G10L15/20;G10L17/00;

  • 国家 US

  • 入库时间 2022-08-21 17:30:14

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号