首页> 中国专利> 突发噪声的处理系统、突发噪声的检测及抑制方法与装置

突发噪声的处理系统、突发噪声的检测及抑制方法与装置

摘要

一种突发噪声的处理系统、突发噪声的检测及抑制方法与装置,所述突发噪声的检测方法包括:以声音信号的逐帧频谱信息中相邻频点的幅度谱计算各频点对应的频谱梯度;基于频谱梯度确定梯度阈值上下限;根据频谱梯度以及梯度阈值上下限确定各频点的幅度谱梯度标志,所述幅度谱梯度标志包括第一梯度标志和第二梯度标志;按频点顺序从各频点中交替搜索出一个对应幅度谱梯度标志为第一梯度标志的第一频点和一个对应幅度谱梯度标志为第二梯度标志的第二频点作为一组频点;若存在至少一组频点的第二频点与第一频点之差小于预设的突发噪声最大频带,则该组频点的第一频点与第二频点为突发噪声对应的频段。本方案能有效检测和抑制背景环境中特定突发噪声。

著录项

  • 公开/公告号CN104575513A

    专利类型发明专利

  • 公开/公告日2015-04-29

    原文格式PDF

  • 申请/专利权人 展讯通信(上海)有限公司;

    申请/专利号CN201310507704.3

  • 申请日2013-10-24

  • 分类号G10L21/0232(20130101);H04M1/19(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人吴靖靓;骆苏华

  • 地址 201203 上海市浦东新区张江高科技园区祖冲之路2288弄展讯中心1号楼

  • 入库时间 2023-12-18 08:30:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-01

    专利权的转移 IPC(主分类):G10L21/0232 专利号:ZL2013105077043 登记生效日:20221020 变更事项:专利权人 变更前权利人:芯鑫融资租赁(北京)有限责任公司 变更后权利人:展讯通信(上海)有限公司 变更事项:地址 变更前权利人:101399 北京市顺义区临空经济核心区融慧园6号楼8-07 变更后权利人:201203 上海市浦东新区张江高科技园区祖冲之路2288弄展讯中心1号楼

    专利申请权、专利权的转移

  • 2019-04-02

    专利权的转移 IPC(主分类):G10L21/0232 登记生效日:20190313 变更前: 变更后: 申请日:20131024

    专利申请权、专利权的转移

  • 2017-11-21

    授权

    授权

  • 2015-05-27

    实质审查的生效 IPC(主分类):G10L21/0232 申请日:20131024

    实质审查的生效

  • 2015-04-29

    公开

    公开

说明书

技术领域

本发明涉及音频处理领域,特别涉及一种突发噪声的处理系统、突发噪 声的检测及抑制方法与装置。

背景技术

移动终端(例如手机)经常在噪声环境下使用,周围噪声会极大地干扰 正常的语音通信,导致语音可懂度降低和语音质量下降,不利于语音通信的 舒适度;同时,录制声音信号时,噪声会干扰所需的目标声音信号。因此, 降低带噪语音中的噪声可以改善语音通信的舒适度,提高录制声音信号的质 量。

通常的移动终端设备使用一个或者多个麦克风进行语音降噪处理,即单 通道和多通道语音降噪技术;单通道语音降噪技术一般适用于对平稳噪声的 抑制或消除,较难于去除非平稳噪声;多通道语音降噪技术可以形成指向性 波束,达到抑制非平稳噪声的目的,由于移动终端设备的尺寸和阵列中麦克 风个数等因素的限制,波束形成技术的性能十分有限。目前广泛使用的多通 道降噪技术大多基于两个麦克风,一个作为主要麦克风拾取目标语音信号(说 话人),一个作为参考麦克风拾取背景噪声,根据主要麦克风和参考麦克风 的相互关系进行语音增强,该方法的性能较传统单通道降噪技术有一定提高, 可以处理某些非平稳噪声。

当移动终端在户外环境使用时,环境噪声中可能会包括一些突发噪声, 比如汽车和火车的鸣笛声、工厂机器噪声等,此类噪声通常能量很强,会极 大地降低通话的语音质量和语音可懂度。当前移动终端使用的单通道和双通 道降噪技术无法有效地消除此类突发噪声,需要根据此类噪声的特点进行专 门处理。

发明内容

本发明解决的问题是现有技术难以有效检测和抑制背景环境中的特定突 发噪声信号。

为解决上述问题,本发明技术方案提供一种突发噪声的检测方法,包括:

以声音信号的逐帧频谱信息中相邻频点的幅度谱计算获得各个频点对应 的频谱梯度;

基于所述频谱梯度确定梯度阈值上下限;

根据所述频谱梯度以及梯度阈值上下限确定各个频点的幅度谱梯度标 志,所述幅度谱梯度标志包括频谱梯度大于梯度阈值上限所对应的第一梯度 标志和频谱梯度小于梯度阈值下限所对应的第二梯度标志;

对于每帧频谱信息,按频点顺序从各个频点中交替搜索出一个对应幅度 谱梯度标志为所述第一梯度标志的第一频点和一个对应幅度谱梯度标志为所 述第二梯度标志的第二频点作为一组频点;

若当前帧频谱信息中存在至少一组频点的所述第二频点与第一频点之差 小于预设的突发噪声最大频带,则将该组频点的第一频点与第二频点识别为 该帧频谱信息中突发噪声对应的频段。

可选的,所述声音信号的逐帧频谱信息通过将输入的时域声音信号进行 离散傅立叶变换后得到。

可选的,交替搜索出第一频点和第二频点作为一组频点从大于频率阈值 的频点开始进行,所述频率阈值高于语音信号的主要能量所在频带。

可选的,所述各个频点对应的频谱梯度通过如下方式计算获得:

XD(k)=0k=0|X(n,k)|-|X(n,k-1)|k=1,2,...,N,其中k为频点序号,XD(k)为序号 为k的频点对应的频谱梯度,n为频谱信息的帧号,|X(n,k)|为帧号n的频谱 信息中序号为k的频点的幅度谱,|X(n,k-1)|为帧号n的频谱信息中序号为k-1 的频点的幅度谱,N为有效频谱点数。

可选的,所述基于所述频谱梯度确定梯度阈值上下限包括:

以XD(k)大于0的平均值与第一系数的乘积作为梯度阈值上限Thup

以XD(k)小于0的平均值与第二系数的乘积作为梯度阈值下限Thdn

所述第一系数和第二系数的取值范围均为(1,+∞)。

可选的,所述根据所述频谱梯度以及梯度阈值上下限确定各个频点的幅 度谱梯度标志包括:

按各个频点对应的频谱梯度、所述梯度阈值上限Thup和梯度阈值下限 Thdn,通过如下方式确定各个频点的幅度谱梯度标志P(k):

P(k)=1XD(k)>Thup0ThdnXD(k)Thup-1XD(k)<Thdn.

可选的,所述对于每帧频谱信息,按频点顺序从各个频点中交替搜索出 一个对应幅度谱梯度标志为所述第一梯度标志的第一频点和一个对应幅度谱 梯度标志为所述第二梯度标志的第二频点作为一组频点包括:

按频点序号由小到大的顺序先搜索出第一个幅度谱梯度标志P(k)=1的第 一频点,该第一频点的频点序号为kdn;

在搜索出频点序号为kdn的第一频点之后,从序号为kdn+1的频点开始 继续搜索出第一个幅度谱梯度标志P(k)=-1的第二频点,该第二频点的频点序 号为kup;

将频点序号为kdn的第一频点和频点序号为kup的第二频点作为搜索出的 一组频点;

从序号为kup+1的频点开始重复上述步骤继续搜索,直至完成对当前帧 频谱信息中序号为N的频点的搜索。

为解决上述问题,本发明技术方案还提供一种突发噪声的检测装置,包 括:

频谱梯度计算单元,适于以声音信号的逐帧频谱信息中相邻频点的幅度 谱计算获得各个频点对应的频谱梯度;

第一确定单元,适于基于所述频谱梯度确定梯度阈值上下限;

第二确定单元,适于根据所述频谱梯度以及梯度阈值上下限确定各个频 点的幅度谱梯度标志,所述幅度谱梯度标志包括频谱梯度大于梯度阈值上限 所对应的第一梯度标志和频谱梯度小于梯度阈值下限所对应的第二梯度标 志;

搜索单元,对于每帧频谱信息,按频点顺序从各个频点中交替搜索出一 个对应幅度谱梯度标志为所述第一梯度标志的第一频点和一个对应幅度谱梯 度标志为所述第二梯度标志的第二频点作为一组频点;

识别单元,适于在当前帧频谱信息中存在至少一组频点的所述第二频点 与第一频点之差小于预设的突发噪声最大频带时,将该组频点的第一频点与 第二频点识别为该帧频谱信息中突发噪声对应的频段。

为解决上述问题,本发明技术方案还提供一种突发噪声的抑制方法,包 括:

以上述突发噪声的检测方法对声音信号的逐帧频谱信息进行检测后,对 于检测出存在突发噪声的各帧频谱信息,将其中识别为该帧频谱信息中突发 噪声对应的频段的第一频点和第二频点之间的所有频点对应的幅度谱进行噪 声抑制处理。

可选的,所述噪声抑制处理通过如下方式进行:

其中n为频谱信息的帧号,k为频点序号,|Y(n,k)|为帧号n的频谱信息中 序号为k的频点的经过所述噪声抑制处理后的幅度谱,α的取值范围为[0,1), |X(n,k)|为帧号n的频谱信息中序号为k的频点的幅度谱,kdn和kup分别为帧 号n的频谱信息中识别为突发噪声对应的频段的第一频点和第二频点的序号, rn为检测出的突发噪声附近频段对应的值。

为解决上述问题,本发明技术方案还提供一种突发噪声的抑制装置,包 括:第一处理单元,适于在上述突发噪声的检测装置检测出存在突发噪声的 各帧频谱信息后,将其中识别为该帧频谱信息中突发噪声对应的频段的第一 频点和第二频点之间的所有频点对应的幅度谱进行突发噪声抑制处理。

为解决上述问题,本发明技术方案还提供一种突发噪声的处理系统,包 括:上述突发噪声的检测装置以及上述突发噪声的抑制装置。

与现有技术相比,本发明的技术方案至少具有以下优点:

通过声音信号的逐帧频谱信息中相邻频点的幅度谱计算出各个频点对应 的频谱梯度,并基于各频点的频谱梯度对应的幅度谱梯度标志,检测各帧频 谱信息中是否存在突发噪声,将搜索出的每一组频点中两者之差小于预设的 突发噪声最大频带的第一频点与第二频点识别为该帧频谱信息中突发噪声谱 峰对应的频段,由此能够实现针对特定突发噪声的特点有效检测出背景环境 中的特定突发噪声信号。

对于检测出存在突发噪声的各帧频谱信息,将其中识别为该帧频谱信息 中突发噪声对应的频段的第一频点和第二频点之间的所有频点对应的幅度谱 进行噪声抑制处理,以实现对特定突发噪声进行针对性的噪声抑制,从而能 够有效降低噪声,改善语音可懂度和语音质量,提高语音通信的舒适度。

附图说明

图1是本发明实施方式提供的突发噪声的检测方法的流程示意图;

图2是本发明实施例一的突发噪声的检测方法的流程示意图;

图3是本发明实施例一的突发噪声频谱搜索的流程示意图;

图4是本发明实施例一的确定突发噪声谱峰的示意图;

图5是本发明实施例一的突发噪声的检测装置的结构示意图;

图6是本发明实施例三的突发噪声的处理系统的结构示意图。

具体实施方式

如背景技术所述,现有的语音降噪技术无法有效地消除环境噪声中可能 会包括的一些如汽车和火车的鸣笛声、工厂机器噪声等突发噪声。本发明实 施方式提出一种突发噪声的检测及抑制方法,根据背景环境中特定突发噪声 的特点进行专门处理,通过分析当前的声音信号频谱中各频点(频率点)的 频谱梯度相对应的幅度谱梯度标志,对是否存在特定突发噪声进行检测,进 而抑制此类噪声,从而能够降低噪声,改善语音可懂度和语音质量,提高语 音通信的舒适度。

参阅图1,本发明实施方式提供的突发噪声的检测方法包括如下步骤:

步骤S1,以声音信号的逐帧频谱信息中相邻频点的幅度谱计算获得各个 频点对应的频谱梯度;

步骤S2,基于所述频谱梯度确定梯度阈值上下限;

步骤S3,根据所述频谱梯度以及梯度阈值上下限确定各个频点的幅度谱 梯度标志,所述幅度谱梯度标志包括频谱梯度大于梯度阈值上限所对应的第 一梯度标志和频谱梯度小于梯度阈值下限所对应的第二梯度标志;

步骤S4,对于每帧频谱信息,按频点顺序从各个频点中交替搜索出一个 对应幅度谱梯度标志为所述第一梯度标志的第一频点和一个对应幅度谱梯度 标志为所述第二梯度标志的第二频点作为一组频点;

步骤S5,若当前帧频谱信息中存在至少一组频点的所述第二频点与第一 频点之差小于预设的突发噪声最大频带,则将该组频点的第一频点与第二频 点识别为该帧频谱信息中突发噪声对应的频段。

基于上述突发噪声的检测方法,本发明实施方式还提供一种突发噪声的 抑制方法,包括:以上述突发噪声的检测方法对声音信号的逐帧频谱信息进 行检测后,对于检测出存在突发噪声的各帧频谱信息,将其中识别为该帧频 谱信息中突发噪声对应的频段的第一频点和第二频点之间的所有频点对应的 幅度谱进行噪声抑制处理。

本发明实施方式提供的突发噪声的检测方法以及抑制方法只针对特定突 发噪声进行处理,对目标声音信号造成的失真很小,保证目标声音信号的同 时尽可能地降低突发噪声,它可以单独使用,也可以结合现有的单通道和多 通道语音降噪技术使用,可以用在语音降噪处理之前作为语音降噪处理的前 处理部分,也可以用在语音降噪处理之后作为语音降噪处理的后处理部分, 两者相结合可以消除目标语音外的其他噪声信号。

为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图 对本发明的具体实施例做详细的说明。

实施例一

本实施例中,以对移动终端(例如手机)采集的声音信号中突发噪声的 检测为例,对所述突发噪声的检测方法的具体实施进行说明。

如图2所示,首先执行步骤S201,将输入的时域声音信号进行短时傅里 叶变换,得到声音信号的逐帧频谱信息。

步骤S201是生成输入时域声音信号的频谱信息的过程。假设移动终端有 L个麦克风,则当前的第j通道麦克风采集到的离散数字声音信号分别表示为 xj(m),j=1,...,L,m表示时间的离散时刻,通过短时傅立叶变换便能够得到逐 帧的频谱信息。

具体地,对采集的时域声音信号通过重叠分帧得到逐帧信号,对每帧信 号进行加窗函数处理,对加窗后的信号进行离散傅立叶变换,分别得到第n 帧的频谱表示为Xj(n,k),其中n为频谱信息的帧号,k表示离散傅立叶变换 后的频点序号,计算公式如下:

Xj(n,k)=Σm=-+xj(m)w(nR-m)e-i2πkm/NFFT---(1)

其中R是逐帧信号的采样点更新数,NFFT是离散傅里叶变换点数,w(m) 是窗函数。窗函数类型可以选择汉明窗、汉宁窗、矩形窗等语音信号处理常 用的窗函数,帧长选择为10~40毫秒(ms),典型值为20ms;前后两帧之间 有重叠,重叠范围根据实际情况选择。

本实施例中,离散傅里叶变换可以通过快速傅立叶变换(FFT,Fast  Fourier Transform)来实现,对加窗后的信号直接进行FFT,或者为了提高频 率分辨率和满足FFT的长度是2的指数倍条件,进行补零操作,如进行NFFT 点FFT变换,可以得到NFFT点频谱值。比如,若采样率Fs为16kHz,选择 汉明窗,帧长为20ms,帧间重叠为50%,则每帧信号共有320个采样点,采 样点更新数R=160,通过在信号末尾补零得到512个采样点,进行NFFT=512 点的FFT可得到512个频点值。

需要说明的是,步骤S201中声音信号的频谱信息处理过程可以和其他语 音信号处理过程共享,比如在其他语音降噪技术中,同样需要生成声音信号 的频谱信息。因此,本发明实施方式提供的突发噪声的检测方法并非必然包 括步骤S201,在其他实施例中,也可以直接对输入的声音信号的逐帧频谱信 息进行后续处理。

步骤S201之后,执行步骤S202,计算所述逐帧频谱信息中各频点的幅度 谱。

本实施例中,根据短时频谱信息计算得到的幅度谱,可以记为|X(n,k)|, 其中|·|为取模符号,以幅度谱作为处理的主要特征。

步骤S202之后,执行步骤S203,以声音信号的逐帧频谱信息中相邻频点 的幅度谱计算获得各个频点对应的频谱梯度。

具体地,根据逐帧频谱信息中各频点的幅度谱|X(n,k)|得到各频点对应的 频谱梯度可以通过如下方式进行计算:

XD(k)=0k=0|X(n,k)|-|X(n,k-1)|k=1,2,...,N---(2)

其中k为频点序号,XD(k)为序号为k的频点对应的频谱梯度,n为频谱信 息的帧号,|X(n,k)|为帧号n的频谱信息中序号为k的频点的幅度谱,|X(n,k-1)| 为帧号n的频谱信息中序号为k-1的频点的幅度谱,N为有效频谱点数,通常 可以为N=NFFT/2+1。

由公式(2)可知,各频点对应的频谱梯度能够反映出各频点的幅度变化 量,后续步骤搜索突发噪声谱峰正是基于各频点的幅度变化情况进行的,至 于所述突发噪声谱峰的确定过程将在下面详细说明。

获得各个频点对应的频谱梯度后,执行步骤S204,基于所述频谱梯度确 定梯度阈值上限和梯度阈值下限。

本实施例中,步骤S204具体可以采用以下方式确定梯度阈值上下限:以 XD(k)大于0的平均值与第一系数μup的乘积作为梯度阈值上限Thup;以XD(k) 小于0的平均值与第二系数μdn的乘积作为梯度阈值下限Thdn;所述第一系数 μup和第二系数μdn的取值范围均为(1,+∞)。

具体地,在计算所述梯度阈值上限Thup时,以XD(k)>0的平均值为基准, 可以通过如下方式表示:

Thup=meanXD(k)>0{XD(k)}*μup---(3)

其中μup的取值范围为μup>1,典型值为5,mean{·}表示计算满足给定条件 的向量的均值。

同时,在计算梯度阈值下限Thdn时,以XD(k)<0的平均值为基准,可以 通过如下方式表示:

Thdn=meanXD(k)<0{XD(k)}*μdn---(4)

其中μdn的取值范围为μdn>1,典型值为4。

确定梯度阈值上下限之后,执行步骤S205,根据所述频谱梯度以及梯度 阈值上下限确定各个频点的幅度谱梯度标志,所述幅度谱梯度标志包括频谱 梯度大于梯度阈值上限所对应的第一梯度标志和频谱梯度小于梯度阈值下限 所对应的第二梯度标志。

本实施例中,根据各频点对应的频谱梯度以及梯度阈值上下限计算各个 频点的幅度谱梯度标志,可以通过如下方式进行:

P(k)=1XD(k)>Thup0ThdnXD(k)Thup-1XD(k)<Thdn---(5)

由公式(5)可以看出,当任一频点对应的频谱梯度大于所述梯度阈值上 限Thup,则该频点对应的幅度谱梯度标志P(k)=1,即所述幅度谱梯度标志P(k) 包括的第一梯度标志为“1”;当任一频点对应的频谱梯度小于所述梯度阈值 下限Thdn,则该频点对应的幅度谱梯度标志P(k)=-1,即所述幅度谱梯度标志 P(k)包括的第二梯度标志为“-1”;当任一频点对应的频谱梯度介于所述梯度 阈值下限Thdn和梯度阈值上限Thup之间,则该频点对应的幅度谱梯度标志 P(k)=0,可以将“0”作为所述幅度谱梯度标志P(k)包括的第三梯度标志。

需要说明的是,本实施例中分别以“1”和“-1”作为所述第一梯度标志 和第二梯度标志,主要是为了便于后续搜索和计算,提高处理效率,在其他 实施例也可以采用其他符号或数字作为第一梯度标志和第二梯度标志。

在确定各频点对应的幅度谱梯度标志之后,执行步骤S206,对于每帧频 谱信息,按频点顺序从各个频点中交替搜索出一个对应幅度谱梯度标志为所 述第一梯度标志的第一频点和一个对应幅度谱梯度标志为所述第二梯度标志 的第二频点作为一组频点。

根据得到的各频点对应的幅度谱梯度标志,便可以开始对逐帧频谱信息 中的突发噪声进行检测。本实施例中,根据各频点对应的幅度谱梯度标志对 逐帧频谱信息中的突发噪声进行检测是通过先搜索出有可能确定为突发噪声 谱峰的一组或一组以上的频点,然后判断每一组频点中的第一频点与第二频 点是否满足可识别为突发噪声的条件。

本实施例中,步骤S206对于每帧频谱信息按频点顺序从各个频点中交替 搜索出第一频点和第二频点作为一组频点的具体实现过程如下:

按频点序号由小到大的顺序先搜索出第一个幅度谱梯度标志P(k)=1的第 一频点,该第一频点的频点序号为kdn;在搜索出频点序号为kdn的第一频点 之后,从序号为kdn+1的频点开始继续搜索出第一个幅度谱梯度标志P(k)=-1 的第二频点,该第二频点的频点序号为kup;将频点序号为kdn的第一频点和 频点序号为kup的第二频点作为搜索出的一组频点;从序号为kup+1的频点 开始重复上述步骤继续搜索,直至完成对当前帧频谱信息中序号为N的频点 的搜索。

在通常情况下,考虑到突发噪声(比如鸣笛声)的主要能量一般集中在 频率较高处,因此,在本实施例中,步骤S206中交替搜索出第二频点和第一 频点作为一组频点是从大于频率阈值的频点开始进行的,所述频率阈值高于 语音信号的主要能量所在频带。由于在语音信号的频带中也有可能搜索出满 足识别为突发噪声对应频段的第一频点和第二频点,因此,从大于所述频率 阈值的频点开始进行搜索的方式,能够防止后续识别是否为突发噪声时产生 误判的情况,进而避免对相应语音信号的误处理,从而能降低语音失真。

在实际实施时,由于语音信号的最主要能量频带通常在1500Hz以下,为 了尽可能降低语音失真,一般要求从1500Hz以上的频率点开始搜索(所述频 率阈值为1500Hz),即满足:

fdn_k>int(1500Fs/NFFT)---(6)

其中int()表示取整数,fdn_k为搜索的起始频率点所对应的频点序号。

搜索出当前帧频谱信息中的一组或一组以上频点后,执行步骤S207,判 断当前帧频谱信息中是否存在至少一组频点的所述第二频点与第一频点之差 小于预设的突发噪声最大频带,是则执行步骤S208,将该组频点的第一频点 与第二频点识别为该帧频谱信息中突发噪声对应的频段,否则执行步骤S209, 识别出当前帧频谱信息中不存在突发噪声,并跳转至步骤S206搜索下一帧频 谱信息中的各组频点。

通过步骤S206能够搜索出有可能确定为突发噪声谱峰的各组频点,然后 通过步骤S207进一步判断根据搜索出的各组频点能否确定为突发噪声谱峰, 从而实现对当前帧频谱信息中突发噪声的检测。

在实际实施时,所述突发噪声最大频带可以根据实际突发噪声的特点进 行有针对性的设定。由于鸣笛声等突发噪声往往是窄带噪声,因此在搜索出 一组频点后,还需要接着判断该组频点中的第二频点与第一频点之差是否小 于预先设定的窄带噪声最大频带,即判断kup-kdn<Mk,其中Mk为预先设定 的窄带噪声最大频带所对应的值,Mk的值还与采样率Fs以及FFT点数NFFT 有关,比如设定突发噪声最大频带为400Hz,在采样率Fs为16kHz和NFFT 为512点时,则:Mk=int(400Fs/NFFT)=12.

如果搜索到的任何一组kup和kdn均无法满足kup-kdn<Mk,则说明当前 帧频谱信息不存在突发噪声,如果搜索到一组或一组以上kup和kdn满足 kup-kdn<Mk,则满足该条件的各组kup和kdn即是该帧中突发噪声谱峰对应 的频段,后续可以用于进行噪声抑制处理。

突发噪声检测和突发噪声频谱搜索过程如图3所示,下面予以详细介绍。

按频点序号由小到大的顺序,从k=fdn_k开始搜索,首先找到第一个满 足P(k)=1的频点,该频点即为搜索出的首个第一频点,通过“kdn=k”实 现赋值后所述第一频点的频点序号为kdn,然后从序号为kdn+1的频点开始搜 索出第一个满足P(k)=-1的频点,该频点即为搜索出的首个第二频点,通 过“kup=k”实现赋值后所述第二频点的频点序号为kup,如此就得到对应的 第一组频点序号kdn和kup。

需要说明的是,本实施例中,在每次搜索出一组频点后,还需要根据该 组频点中的第一频点和第二频点进一步识别该组频点是否为能够确定突发噪 声谱峰对应频段的一组频点,即判断该组频点中序号为kup的第二频点与序 号为kdn的第一频点是否满足kup-kdn<Mk,若是则表明该组频点是能够确定 为突发噪声谱峰的一组kup和kdn,并搜索当前帧频谱信息中的下一组频点, 否则直接开始搜索下一组频点。在其他实施例中,也可以在当前帧频谱信息 中先搜索出各组频点,进而判断各组频点是否满足确定为突发噪声谱峰的条 件。

在找到第一组频点并判断是否满足确定为突发噪声谱峰的条件后,以上 述同样的方式从序号为kup+1的频点开始继续搜索出第二个满足P(k)=1的 频点以及第二个满足P(k)=-1的频点、第三个满足P(k)=1的频点以及第 三个满足P(k)=-1的频点,……,以此类推,直至完成对当前帧频谱信息 中序号为N的频点的搜索,并在搜索出之后一一判断是否满足确定为突发噪 声谱峰的条件。

在整个搜索过程中,通过“k=k+1”实现频点序号k的不断递增,直至k=N (不再满足“k<N”),即表示完成对当前帧频谱信息中所有有效频点的搜索。

为了便于更为直观地理解上述确定突发噪声谱峰的过程,下面结合图4 进行说明。

图4示出的坐标轴中,横轴表示频谱信息中的各频点,频率沿横轴箭头 方向由小到大依次递增,纵轴表示各频点对应的幅度谱梯度标志P(k),可以 理解的是,将各频点对应的频谱梯度进一步转化为各自对应的幅度谱梯度标 志后,各频点的幅度变化情况就更容易被体现出来了,考察幅度变化情况存 在短时较大突变的频点将有可能寻找出突发噪声谱峰。

如图4所示,沿横轴向右方向依次搜索,假设频点B是搜索过程中找到 的第一个满足P(k)=1的频点,频点B可以认为是幅度变化情况存在短时较 大突变的一个起始频点,在频点B之前,会出现P(k)=0的频点,例如频点 A,在频点B之后,通常还会出现P(k)=1和P(k)=0的频点,例如频点 C和频点D,由频点B开始构成频谱峰值的上升沿,假设频点E是找到的第 一个满足P(k)=-1的频点,频点E可以认为是幅度变化情况存在短时较大 突变的一个终止频点,至频点E构成频谱峰值的下降沿。由此可知,频点B、 频点E及其中间的频点构成的频谱则可能为突发噪声谱峰。若频点B的频点 序号为kdn,频点E的频点序号为kup,则判断kup-kdn<Mk是否满足就可以 确定频点B、频点E及其中间的频点构成的频谱是否为突发噪声谱峰。当然, 在频点E之后,需要按照上述方式继续去搜索第二个满足P(k)=1的频点, 在搜索过程中通常先会出现P(k)=-1和P(k)=0的频点,例如频点F和频 点G。

对应于上述突发噪声的检测方法,本实施例还提供一种突发噪声的检测 装置。如图5所示,所述突发噪声的检测装置10包括:频谱梯度计算单元101, 适于以声音信号的逐帧频谱信息中相邻频点的幅度谱计算获得各个频点对应 的频谱梯度;第一确定单元102,适于基于所述频谱梯度确定梯度阈值上下限; 第二确定单元103,适于根据所述频谱梯度以及梯度阈值上下限确定各个频点 的幅度谱梯度标志,所述幅度谱梯度标志包括频谱梯度大于梯度阈值上限所 对应的第一梯度标志和频谱梯度小于梯度阈值下限所对应的第二梯度标志; 搜索单元104,对于每帧频谱信息,按频点顺序从各个频点中交替搜索出一个 对应幅度谱梯度标志为所述第一梯度标志的第一频点和一个对应幅度谱梯度 标志为所述第二梯度标志的第二频点作为一组频点;识别单元105,适于在当 前帧频谱信息中存在至少一组频点的所述第二频点与第一频点之差小于预设 的突发噪声最大频带时,将该组频点的第一频点与第二频点识别为该帧频谱 信息中突发噪声对应的频段。

本实施例中,所述搜索单元104从大于频率阈值的频点开始搜索,所述 频率阈值对应于语音信号的频带的最高频率。

所述突发噪声的检测装置的具体实施可以参考本实施例所述突发噪声的 检测方法的实施,此处不再赘述。

实施例二

在实施例一的基础上,本实施例对所述突发噪声的抑制方法的具体实施 进行说明。

以实施例一提供的突发噪声的检测方法对声音信号的逐帧频谱信息进行 检测后,对于检测出存在突发噪声的各帧频谱信息,将其中识别为该帧频谱 信息中突发噪声对应的频段的第一频点和第二频点之间的所有频点对应的幅 度谱进行噪声抑制处理。

具体地,对于各帧频谱信息,如果检测出不存在突发噪声,则不对声音 信号进行处理,如果检测出存在突发噪声,则对搜索得到的一组或一组以上 满足kup-kdn<Mk的kup和kdn进行处理。本实施例中,所述噪声抑制处理通 过对突发噪声及其附近频带给一较小增益,得到处理后幅度谱|Y(n,k)|如下:

其中n为频谱信息的帧号,k为频点序号,|Y(n,k)|为帧号n的频谱信息中 序号为k的频点的经过所述噪声抑制处理后的幅度谱,α为一较小值,α的取 值范围为[0,1),其典型值为0,|X(n,k)|为帧号n的频谱信息中序号为k的频 点的幅度谱,kdn和kup分别为帧号n的频谱信息中识别为突发噪声对应的频 段的第一频点和第二频点的序号,rn为检测出的突发噪声附近频段对应的值, rn的取值范围为0~10,典型值为4,该值与采样率Fs、FFT点数NFFT有关。

本实施例中,对于经过上述噪声抑制处理后的频谱信息,可以进一步通 过短时傅立叶逆变换重新得到时域声音信号。具体地,使用未处理声音信号 的相位谱∠X(n,k)作为处理后声音信号的相位谱,并将该相位谱与经过所述噪 声抑制处理之后声音信号的幅度谱进行计算,得到处理后声音信号的逐帧频 谱信息Y(n,k)=|Y(n,k)|*exp[i*∠X(n,k)],接着通过短时傅里叶逆变换得到逐帧 的时域声音信号,重叠相加得到处理后的声音信号。

在实际实施时,实施例一的突发噪声的检测方法以及实施例二的突发噪 声的抑制方法可以单独使用,也可以和其他处理过程结合使用,例如可以单 独对输入声音信号进行处理,也可以作为声音信号处理的其中一个环节。此 外,所述突发噪声的检测方法以及突发噪声的抑制方法可以在其他语音降噪 技术之前作为前处理,也可以在其他语音降噪技术之后作为后处理,当作为 前处理时,对各个通道的声音信号分别进行处理,处理之后的各个通道信号 作为其他语音降噪技术的输入信号,当作为后处理时,对其他语音降噪技术 输出的增强后信号进行处理。

对应于上述突发噪声的抑制方法,本实施例还提供一种突发噪声的抑制 装置,所述突发噪声的抑制装置包括:第一处理单元,适于在上述突发噪声 的检测装置检测出存在突发噪声的各帧频谱信息后,将其中识别为该帧频谱 信息中突发噪声对应的频段的第一频点和第二频点之间的所有频点对应的幅 度谱进行突发噪声抑制处理。

所述突发噪声的抑制装置的具体实施可以参考本实施例所述突发噪声的 抑制方法的实施,此处不再赘述。

实施例三

在实施例一提供的突发噪声的检测装置以及实施例二提供的突发噪声的 抑制装置,本实施例提供一种突发噪声的处理系统。

如图6所示,本实施例提供的突发噪声的处理系统包括:实施例一提供 的突发噪声的检测装置10以及实施例二提供的突发噪声的抑制装置20,所述 突发噪声的抑制装置20包括第一处理单元201。

本实施例中,所述突发噪声的处理系统还包括第一变换单元30,适于将 输入的时域声音信号进行离散傅立叶变换以得到所述声音信号的逐帧频谱信 息。

所述突发噪声的处理系统还包括第二处理单元40,适于以所述突发噪声 抑制处理之前声音信号的相位谱作为所述突发噪声抑制处理之后声音信号的 相位谱,并将其与经过所述突发噪声抑制处理之后声音信号的幅度谱进行计 算,得到经过所述突发噪声抑制处理后声音信号的逐帧频谱信息。

所述突发噪声的处理系统还包括第二变换单元50,适于将经过所述突发 噪声抑制处理后声音信号的逐帧频谱信息进行离散傅立叶逆变换以得到处理 后的时域声音信号。

需要说明的是,在实际实施时,可以将所述第一变换单元30、第二处理 单元40、第二变换单元50与所述突发噪声的检测装置10和突发噪声的抑制 装置20集成在一起作为单独模块使用,即输入和输出都为时域信号,有独立 的短时傅立叶变换和逆变换,也可以将所述突发噪声的检测装置10和突发噪 声的抑制装置20作为一个模块集成在其他语音信号处理模块之内,此时输入 和输出都为短时频谱信息。

本领域技术人员可以理解,实现上述实施例中突发噪声的处理系统及其 突发噪声的抑制装置的全部或部分是可以通过程序来指令相关的硬件来完 成,所述的程序可以存储于计算机可读存储介质中,所述存储介质可以是 ROM、RAM、磁碟、光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员, 在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保 护范围应当以权利要求所限定的范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号