首页> 中国专利> 一种复杂噪声场景下的实时语音段落追踪方法

一种复杂噪声场景下的实时语音段落追踪方法

摘要

本发明公开了一种复杂噪声场景下的实时语音段落追踪方法,包含以下步骤:A、预处理;B、计算输入音频帧的离散傅里叶变换系数,C、假设前帧为噪声帧,计算初始噪声的功率,即计算傅里叶变换幅度谱的算术平均值;假设帧后的数据为带噪信号,计算带噪信号的功率;D、计算后验信噪比;E、计算先验信噪比;F、语音激活检测;G、噪声谱更新;H、计算增益系数,先利用语段之间的段落噪声估计场景中平稳噪声的频谱属性,然后设计增益函数增强语音、抑制平稳噪声。在此基础上进行浊音检测,追踪语音段落,并屏蔽语段之间的各类噪声。这样可以提高语音检测的准确率,抑制语音段叠加的噪声,以及彻底屏蔽影响听感的语段间的噪声。

著录项

  • 公开/公告号CN111261197B

    专利类型发明专利

  • 公开/公告日2022.11.25

    原文格式PDF

  • 申请/专利权人 中航华东光电(上海)有限公司;

    申请/专利号CN202010029721.0

  • 发明设计人 马翼平;张玮;

    申请日2020.01.13

  • 分类号G10L25/84;G10L25/27;G10L25/45;G10L25/21;G10L25/93;G10L21/0216;

  • 代理机构上海乐泓专利代理事务所(普通合伙);

  • 代理人张雪

  • 地址 201114 上海市闵行区新骏环路115号1号楼3层

  • 入库时间 2022-12-29 02:02:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号