首页> 中国专利> 去除语音信号中背景噪声的方法

去除语音信号中背景噪声的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种去除语音信号中背景噪声的方法，包括下列步骤。首先，定义频带i的衰减系数，然后根据相邻频带的衰减系数作平滑滤波处理，以计算频带i的顺向衰减系数以及反向衰减系数。接着对顺向衰减系数及反向衰减系数作线性组合以计算频带i的平滑衰减系数。然后使用平滑衰减系数计算语音频谱估测值。最后，使用傅立叶反变换以得到去除背景噪声后的语音信号。

著录项

公开/公告号CN1991980A

专利类型发明专利
公开/公告日2007-07-04

原文格式PDF
申请/专利权人财团法人工业技术研究院;
展开▼

申请/专利号CN200510137451.0
发明设计人黄泰惠;
展开▼

申请日2005-12-30
分类号G10L21/02(20060101);H04R25/00(20060101);
代理机构11278 北京连和连知识产权代理有限公司;
代理人王永红
地址台湾省新竹县竹东镇中兴路四段195号
入库时间 2023-12-17 18:50:31

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-09

未缴年费专利权终止 IPC(主分类):G10L21/02 专利号:ZL2005101374510 申请日:20051230 授权公告日:20091202

专利权的终止
2009-12-02

授权

授权
2007-08-29

实质审查的生效

实质审查的生效
2007-07-04

公开

公开

说明书

技术领域

本发明涉及一种去除语音信号中背景噪声(background noise)的方法，且特别涉及一种对各频带的衰减系数(attenuation factor)作平滑滤波处理的语音信号处理方法。

背景技术

根据助听器的使用满意度调查结果显示，助听器使用者常有“环境噪音过度放大令人感到疲倦”和“听得见却听不清楚”的抱怨。因此，去除信号中的噪声以提高配戴舒适度成为目前研发数字助听器技术的重要课题之一。目前一些去除语音信号中的背景噪声的方法虽可明显提高信噪比(signal to noise ratio，简称为SNR)，但是对语音可辨识度的改善并不明显，甚至附带产生额外的噪声(泛称为musical noise)或者破坏语音的流畅度。

背景噪声干扰为一种时域(time domain)波形叠加作用，最初接收到的噪声语音信号可表示为y[n]＝x[n]+w[n]，其中x[n]表示未受干扰的语音信号，w[n]则表示背景噪声。

传统的去除噪声方法可表示为 $>ver>>X>^>>[>i>]>=>γ>[>i>]>Y>[>i>]>,>$ >其中Y[i]为噪声语音信号y[n]经过快速傅立叶变换(fast Fourier transform)后属于频带i的部分，i∈[0，N-1]，N为频带数量，|Y[i]|表示噪声语音信号y[n]在频带i的振幅，而γ[i]表示上述振幅的衰减系数。

传统的衰减系数计算方法为 $>>γ>[>i>]>=>>>>|>D>[>i>]>|>>2>>>>|>Y>[>i>]>|>>2> >,>$ >其中 $>>>>|>D>[>i>]>|>>2>>=> \begin{matrix} >>>>>|>Y>[>i>]>|>>2>>->α>>>|>W>[>i>]>|>>2>>,>if>>>|>Y>[>i>]>|>>2>>≥>>α>>1>->β> >>>|>W>[>i>]>|>>2>>>>>>β>>>|>Y>[>i>]>|>>2>>,>elsewhere>>> > \end{matrix}$ >|W[i]²为背景噪声在频带i的能量，α和β为预设之系数。如此，计算出 $>ver>>X>^>>[>i>]>=>γ>[>i>]>Y>[>i>]>$ >之后，接着对做傅立叶反变换(inverse Fourier transform)，即可得到去除背景噪声后的语音信号。

语音信号在相邻的频带之间有相关性，然而如上所述，传统方法并未利用这一点，传统的振幅衰减系数是在每个频带分开计算。所以传统方法应有改进的空间。

发明内容

本发明的目的是提供一种去除语音信号中背景噪声的方法，本方法可提高去除背景噪声后的语音音质以及可辨识度。

为达到上述及其它目的，本发明提出一种去除语音信号中背景噪声的方法，包括下列步骤。首先，定义频带i的衰减系数 $>>γ>[>i>]>=>>>>|>D>[>i>]>|>>2>>>>|>Y>[>i>]>|>>2> >,>$ >其中 $>>>>|>D>[>i>]>|>>2>>=> \begin{matrix} >>>>>|>Y>[>i>]>|>>2>>->α>>>|>W>[>i>]>|>>2>>,>if>>>|>Y>[>i>]>|>>2>>≥>>α>>1>->β> >>>|>W>[>i>]>|>>2>>>>>>β>>>|>Y>[>i>]>|>>2>>,>elsewhere>>> > \end{matrix}$ >|Y[i]|²为噪声语音信号在频带i的能量，|W[i]|²为背景噪声在频带i的能量，i∈[0，N-1]，N为频带数量，α和β为预设之系数。然后计算频带i的顺向衰减系数γ_f[i]≡γ[i]＝λ_f·γ[i]+(1-λ_f)γ[i-1]，其中λ_f为预设的系数。然后计算频带i的反向衰减系数γ_b[i]＝λ_b·γ_b[i]+(1-λ_b)γ_b[i-1]，其中γ_b[i]＝γ[N-1-i]，λ_b为预设的系数。接着计算频带i的平滑衰减系数 $>ver>>γ>^>>[>i>]>=>>λ>c>>·>ver>>γ>‾>>f>>[>i>]>+>>(>1>->>λ>c>>)>>ver>>γ>‾>>b>>[>N>->1>->i>]>)>,>$ >其中λ_c为预设的系数。然后根据平滑衰减系数计算语音频谱估测值 $>ver>>X>^>>[>i>]>=ver>>γ>^>>[>i>]>Y>[>i>]>.>$ >最后，将作傅立叶反变换，得到去除背景噪声后的语音信号。

上述之去除语音信号中背景噪声的方法，在一实施例中，γ[-1]＝γ[0]，而且 $>>ver>>γ>‾>>b>>[>->1>]>=>γ>[>N>->1>]>.>$ >

依照本发明的较佳实施例所述，上述之去除语音信号中背景噪声的方法是利用语音信号在相邻频带之间的关联性对衰减系数作平滑滤波处理，以取代传统的振幅衰减系数，实验结果证明此方法可以提高去除背景噪声后的语音音质以及可辨识度。

为让本发明的上述和其它目的、特征和优点能更明显易懂，下文特举本发明之较佳实施例，并配合附图，作详细说明如下。

附图说明

图1为根据本发明一实施例的去除语音信号中背景噪声的方法流程图。

图2为传统技术以及本发明一实施例的衰减系数对照图。

主要元件标记说明

110～160：流程图步骤

具体实施方式

由传统方法所得到的去除噪声后的语音频谱是由各频带独立计算而来，本发明提出的方法则是利用频带间的相依关系以提高去噪声处理后语音的可辨识度。

以下说明请参照图1。图1为根据本发明一实施例的去除语音信号中背景噪声的方法流程图。首先，在步骤110定义各频带的衰减系数。假设本实施例的频带数量为N，i∈[0，N-1]，则频带i的衰减系数定义为 $>>γ>[>i>]>=>>>>|>D>[>i>]>|>>2>>>>|>Y>[>i>]>|>>2> >,>$ >其中 $>>>>|>D>[>i>]>|>>2>>=> \begin{matrix} >>>>>|>Y>[>i>]>|>>2>>->α>>>|>W>[>i>]>|>>2>>,>if>>>|>Y>[>i>]>|>>2>>≥>>α>>1>->β> >>>|>W>[>i>]>|>>2>>>>>>β>>>|>Y>[>i>]>|>>2>>,>elsewhere>>> > \end{matrix}$ >|Y[i]|²为最初接收的噪声语音信号在频带i的能量，|W[i]|²为背景噪声在频带i的能量，α和β为预设之系数。

定义衰减系数后，在步骤120利用一阶IIR(infinite impulse response)滤波器q[n]＝λp[n]+(1-λ)q[n-1]对频带i的衰减系数γ[i]作滤波处理，以计算频带i的顺向衰减系数γ_f[i]。本实施例的计算公式为γ_f[i]≡γ[i]＝λ_f·γ[i]+(1-λ_f)γ[i-1]，其中λ_f为预设的系数。经过简单的推算可知，顺向衰减系数γ_f[i]为根据γ[0]至γ[i]计算而来。

接下来，在步骤130利用上述的一阶IIR滤波器对频带顺序反置的衰减系数γ[i]作滤波处理，以计算频带i的反向衰减系数γ_b[i]。本实施例的计算公式为γ_b[i]＝λ_b·γ_b[i]+(1-λ_b)γ_b[i-1]，其中γ_b[i]＝γ[N-1-i]，λ_b为预设的系数。经过简单的推算可知，反向衰减系数γ_b[i]为根据γ[N-1-i]至γ[N-1]计算而来。

在上述的差分方程式运算中，初始条件为γ[-1]＝γ[0]，而且γ_b[-1]＝γ[N-1]。

接下来，在步骤140将顺向和反向的滤波结果作线性组合以计算频带i的平滑衰减系数本实施例的计算公式为 $>ver>>γ>^>>[>i>]>=>>λ>c>>·>ver>>γ>‾>>f>>[>i>]>+>>(>1>->>λ>c>>)>>ver>>γ>‾>>b>>[>N>->1>->i>]>)>,>$ >其中λ_c为预设的系数。然后在步骤150计算平滑处理后的语音频谱估测值 $>ver>>X>^>>[>i>]>=ver>>γ>^>>[>i>]>Y>[>i>]>,>$ >最后，在步骤160将作傅立叶反变换，就能得到去除背景噪声后的语音信号。

图2为传统技术以及本实施例的衰减系数对照图，其横轴为频带编号，其纵轴为衰减系数值。图2的设定为λ_f＝λ_b＝λ_c＝0.5，除了标明为传统技术的折线之外，其余折线皆为本实施例的数据。由图2可以发现，合并顺向及反向的结果使得每一频带的衰减系数会受到其左右频带衰减系数的影响而调整其值，因此可达到利用频带间相依关系调整频带衰减系数的目的。

以下说明本实施例的实验结果，首先是关于音节辨识率的实验。这个实验是以18位男性和11位女性在安静室内各念120个中文人名的干净语音数据库训练中文音节模型。至于背景噪声，是将此干净语音数据库分别加入操作房噪声、白色噪声、人声噪声和工厂噪声，其中每种噪声分别依信噪比20dB、15dB、10dB、5dB和0dB由波形合成而得。将此噪声语音数据库的每个语音档案，用本实施例的方法做去除噪声处理，然后以干净语音模型做自动音节辨识，得到如下的结果。下列每一个实验数据都是四种噪声和五种信噪比，总共二十种组合的平均值。

表1、本实施例的音节辨识率实验数据

λ值 1.0 0.7 0.6 0.55 0.5 0.45 0.4 音节正确率(％) 41.8 44.8 45.6 45.8 46.1 46.2 45.9

在本实验中λ_f＝λ_b＝λ，λ＝1时平滑衰减系数等于传统的衰减系数γ[i]，所以λ＝1时的41.8％就是传统方法的实验数据。另一方面，完全不做去除噪声的音节正确率为32.9％。由表1可知，本实施例的方法确实可提高去除噪声后的辨识率，在λ＝0.45时可达到最高辨识率46.2％。

第二个实验是以测量音质好坏的语音音质听觉评量(perceptualevaluation of speech quality，简称为PESQ)来比较不同方法的结果。PESQ分数范围为[0，4]，其中4为音质无失真的最高分数。实验结果如下表所示。

表2、去除背景噪声后的语音音质测量

λ值 1.0 0.5 PESQ分数 2.44 2.45

同样的，在本实验中λ_f＝λ_b＝λ，λ＝1时的2.44为传统方法的PESQ分数。另一方面，完全不做去除噪声的分数为2.08。由表2可知，本实施例的方法确实可提高去除背景噪声后的语音音质。

本发明虽然是受到数字助听器的启发，但是本发明的应用并不限于数字助听器，也可以应用于其它领域，例如录音笔之类的数字录音应用。

综上所述，本发明提出的去除语音信号中背景噪声的方法，是利用语音信号在相邻频带之间的关联性对衰减系数作平滑滤波处理，以取代传统的振幅衰减系数，实验结果证明上述方法可以提高去除背景噪声后的语音音质以及可辨识度。

虽然本发明已以较佳实施例披露如上，然其并非用以限定本发明，任何所属技术领域的技术人员，在不脱离本发明的精神和范围内，当可作些许的更动与改进，因此本发明的保护范围当视权利要求所界定者为准。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 去除语音信号中背景噪声的方法 [P] . 中国专利： CN100565672C . 2009.12.02
2. 用于恢复由于对测试语音信号进行噪声去除导致在测试噪声去除后语音信号中衰减的谱成分的方法 [P] . 中国专利： CN103238181B . 2015.06.10
3. Method for removing background noise in a speech signal [P] . 美国专利： US2007150270A1 . 2007-06-28

机译：去除语音信号中背景噪声的方法
4. Method and device for the objective evaluation of the voice quality of a speech signal taking into account the classification of the background noise contained in the signal [P] . 美国专利： US8886529B2 . 2014-11-11

机译：考虑到信号中包含的背景噪声的分类，对语音信号的语音质量进行客观评估的方法和设备
5. Method for determining intensity parameters of background noise in speech pauses of voice signals [P] . 美国专利： US7277847B2 . 2007-10-02

机译：确定语音信号语音停顿中背景噪声强度参数的方法