首页> 中国专利> 一种用于数字助听器的多通道宽动态范围压缩系统

一种用于数字助听器的多通道宽动态范围压缩系统

摘要

本发明涉及一种基于听觉感知模型的多通道宽动态范围压缩系统,包括:模拟听觉感知模型的分析滤波器组、声压级检测模块、压缩放大增益计算模块、乘法器和模拟听觉感知模型的综合滤波器组;音频数字信号x(n)经分析滤波器组后分成K个通道,声压级检测模块检测各个通道的声压级,压缩放大增益计算模块计算得到各个通道的具体增益值,乘法器将通道增益值与对应子带信号相乘,所得结果通过综合滤波器组综合成一路输出信号y(n);该滤波器组通过加权叠接相加结构与全通变换相结合的方式,在加权叠接相加结构的分析滤波器组和综合滤波器组中分别进行全通变换和全通反变换,实现在通道数目较少的情况下模拟人耳听觉分辨率。

著录项

  • 公开/公告号CN101695148A

    专利类型发明专利

  • 公开/公告日2010-04-14

    原文格式PDF

  • 申请/专利权人 中国科学院声学研究所;

    申请/专利号CN200910236221.8

  • 发明设计人 孟晓辉;肖灵;崔杰;

    申请日2009-10-23

  • 分类号H04R25/00;H03H17/00;

  • 代理机构北京法思腾知识产权代理有限公司;

  • 代理人杨小蓉

  • 地址 100190 北京市海淀区北四环西路21号中国科学院声学研究所

  • 入库时间 2023-12-17 23:44:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-12-07

    未缴年费专利权终止 IPC(主分类):H04R25/00 授权公告日:20120905 终止日期:20151023 申请日:20091023

    专利权的终止

  • 2012-09-05

    授权

    授权

  • 2010-05-26

    实质审查的生效 IPC(主分类):H04R25/00 申请日:20091023

    实质审查的生效

  • 2010-04-14

    公开

    公开

说明书

技术领域

本发明涉及数字助听器中的数字信号处理技术,特别地,涉及一种用于数字助听器的多通道宽动态范围压缩系统,用于压缩放大数字助听器的音频信号。

背景技术

听力损失,尤其是感音神经性听力损失除了表现为听阈上升外,大部分患者的不舒适阈不变甚至下降,造成听觉宽动态范围减小。针对这一特点,数字助听器通常采用宽动态范围压缩(WDRC),将输入信号宽动态范围按一定的比例压缩到听障者残余的听力动态范围内。另外,听障者可能对某一频率范围的声音感知和普通人相同,但却无法和普通人一样听到其它频率的声压级较低的声音,解决这个问题的方法是进行多通道宽动态范围压缩。典型的多通道WDRC系统是先用滤波器组将信号划分为多个通道,对每个通道的信号单独进行压缩处理,这样可以根据该频率对应的听力损失情况设计合适的压缩比和压缩阈值,更灵活地进行听力补偿。最后,将处理后的各通道信号综合成一路信号。

因此,数字滤波器组的选择对于数字助听器的多通道宽动态范围压缩系统的信号质量、计算复杂度和信号延迟有重要影响。数字滤波器组按照带宽情况可以分为均匀滤波器组和非均匀滤波器组两种,在均匀滤波器组中,离散傅立叶变换(DFT)分析-综合滤波器组应用比较广泛,这种复调制滤波器组可以用多相(polyphase)结构或者加权叠接相加(weighted overlap-add,WOLA)结构高效实现,其中,WOLA结构通过改变DFT滤波器组升/降采样的位置,将卷积运算转化为加权运算且多通道共享加权过程,和用快速傅立叶变换(FFT)实现DFT,使得DFT滤波器组的实现效率大大提高。

然而,DFT滤波器组的频率分辨率不适合人类的听觉系统,因为人耳的频率分辨率是非均匀的,随着频率增大而降低,其实际感知频率尺度(听觉频率尺度)与普通频率尺度之间呈非线性关系,可以用Bark频率尺度表示。若采用均匀滤波器组,要使频率分辨率达到Bark频率尺度,要求通道划分很细,而这会造成高频部分的通道划分过细,浪费资源。因此,许多研究者提出在语音处理系统中用非均匀分析-综合滤波器组来处理音频信号,这种方法可行的原因有二:一是近似Bark频率尺度的非均匀滤波器组结合了听觉感知模型;二是,一般情况下,语音信号的能量主要集中在低频部分。

用非均匀滤波器组获得近似Bark频率尺度的方法之一是采用离散小波(包)变换,实现这一变换可以采用树形结构;另一种方法是采用非线性频率变换的分析-综合滤波器组,这种方法的信号延时和计算复杂度往往比树形结构滤波器组低。

设计非线性频率变换的分析-综合滤波器组通常采用一阶全通变换(allpasstransformation)法,通过调节一阶全通滤波器-1<b<1的极点b的取值,可以很好地模拟Bark频率尺度变换,这使得全通变换分析-综合滤波器组达到人耳频率分辨率所需的通道数目明显小于均匀滤波器组,所以更适合用于语音信号处理系统或类似的其它应用中。

目前,非线性频率变换的分析-综合滤波器组主要有两类实现方式,一是将整个信号进行全通变换,再用均匀滤波器组处理,这样,在变换后的频率尺度上做均匀通道划分,就相当于在原频率尺度上做非均匀通道划分,此类方法需要对整个信号做时间翻转运算,因此,不能用于实时信号处理;二是用全通滤波器A(z)代替多相结构或WOLA结构中的延迟单元z-1,这样做的缺点是全通滤波器会造成相位失真,补偿这些失真使得综合滤波器组的设计更加复杂,同时会增加计算复杂度和信号延时。

多通道WDRC系统设计中的一个关键问题是如何使系统的频率分辨率与人类听觉系统的频率分辨率相匹配,又可以尽量减少通道数目。针对以离散傅立叶变换(DFT)为基础的多通道WDRC系统只能提供均匀通道划分的问题,专利号为US7277554的发明提出了用一阶全通滤波器A(z)代替离散傅立叶变换中的延迟单元z-1,从而实现在非线性频率变换域上计算压缩放大增益的宽动态范围压缩系统(Warped WDRC),适当选择全通滤波器A(z)的极点位置,该系统可以较好地模拟听觉系统。但是,由于全通滤波器的群延迟与频率有关,该系统会造成信号的不同频率成分通过该系统的时间不同,导致信号失真,这种由于频率相关的群延迟产生的信号失真在通道数目较多时尤为严重。

发明内容

本发明的目的是,针对上述几种方法存在的问题,提供一种用于数字助听器的多通道宽动态范围压缩系统,其中使用的模拟听觉感知模型的滤波器组(以下简称Warped WOLA滤波器组)将均匀DFT滤波器组的高效实现方法加权叠接相加(weighted overlap-add,WOLA)结构与全通变换相结合,以用较少的通道数目的滤波器组对音频信号实现近似人耳听觉分辨率的非均匀通道划分,同时,保证信号重建效果,并使其具有较低的计算复杂度。模拟听觉感知模型的滤波器组只对有限长信号片段做全通变换,所以可以应用于实时信号处理。而且,模拟听觉感知模型的滤波器组因为在综合过程中加入了全通反变换操作,所以基本不会产生由于全通变换引起的相位失真。另外,模拟听觉感知模型的滤波器组可以用较少的通道数目模拟人耳听觉分辨率,无需均匀DFT滤波器组中先做较多数目的分通道,再将高频通道进行合并来模拟人耳听觉分辨率的过程。

为了实现上述目的,本发明所述的模拟听觉感知模型的滤波器组实现信号分通道和信号综合,该滤波器组采用一种用加权叠接相加结构与全通变换相结合的方式,在加权叠接相加结构的分析和综合过程中适当的位置分别加入全通变换和全通反变换,从而实现在通道数目较少的情况下模拟人耳听觉分辨率,同时保证信号重建效果,另外,采用加权叠接相加结构使本发明的一种模拟听觉感知模型的滤波器组具有较低的计算复杂度。

本发明涉及一种基于听觉感知模型的多通道宽动态范围压缩系统,包括:模拟听觉感知模型的分析滤波器组2、声压级检测模块3、压缩放大增益计算模块4和模拟听觉感知模型的综合滤波器组6;音频数字信号x(n)1经分析滤波器组2后分成K个通道,经声压级检测模块3检测各个通道的声压级、压缩放大增益计算模块4计算得到各个通道的具体增益值后,乘法器5将通道增益值与对应子带信号相乘,所得结果通过综合滤波器组6综合成一路输出信号y(n)7;该滤波器组通过加权叠接相加结构与全通变换相结合的方式,在加权叠接相加结构的分析滤波器组2和综合滤波器组6中分别进行全通变换和全通反变换,实现在通道数目较少的情况下模拟人耳听觉分辨率。所述的模拟听觉感知模型的分析滤波器组2通过全通变换,以及调整全通变换参数,得到非均匀通道划分,实现步骤包括:

1)截取信号的步骤,截取有限长信号片段,长度P的取值为不大于(1+|b|)L/(1-|b|)的最大整数,截取步长为D,其中L为分析原型滤波器的长度,b为全通变换参数,D为降采样率;

2)全通变换的步骤,对有限长信号片段进行全通变换;所述的全通变换为L-1阶、全通变换参数为b的全通变换,L-1为全通滤波器的个数;

3)加权处理的步骤,用分析原型滤波器的时间翻转h(-r)对全通变换的结果做加权处理;

4)时间叠加的步骤,将加权处理的结果平均分成L/K个长度为K的小片段,并将这些小片段相加,L为分析原型滤波器的长度;

5)离散傅立叶变换的步骤,进行K点离散傅立叶变换,K为通道数目;

6)用中心频率调整系数exp(jmDθ-1k))乘以离散傅立叶变换的结果,得到各个通道信号的序列,其为第k个分量对应第k个通道m时刻的输出,其中ωk=2kπ/K,k=0,...,K-1。

上述技术方案中,所述的步骤2)的全通变换,步骤包括:

21)对于有限长信号s(n)13,先做时间翻转14得到s(N-n);

22)然后,经过全通滤波器A(z)15链,当n=N时取值,得到非线性频率变换结果;其中,

A(z)=z-1-b1-bz-1,-1<b<1

在单位圆上,有A(e)=ejθ(ω),其中

θ(ω)=argA(e)=ω+2tan-1(bsin(ω)1-bcos(ω)),

式中ω=2πf/fs,fs为采样率。

所述的离散傅立叶变换可以用快速傅立叶变换实现。

所述的截取信号片段的长度P与分析原型滤波器的长度L之间满足:P是不大于(1+|b|)L/(1-|b|)的最大整数。

所述的模拟听觉感知模型的综合滤波器组6通过全通反变换,将全通变换后的频率尺度再变换成原来的频率尺度,实现步骤包括:

1)将各通道信号序列乘以另一组中心频率调整系数exp(-jmDθ-1k)),其中,ωk=2kπ/K,k=0,...,K-1;

2)离散傅立叶反变换的步骤,进行K点离散傅立叶反变换(IDFT);

3)将离散傅立叶反变换的结果复制L/K次,形成一个长度为L的序列;

4)用综合原型滤波器f(r)对上述长度为L的序列进行加权处理;

5)全通反变换的步骤,对加权处理的结果进行P-1阶参数为b的全通反变换;

6)叠加的步骤,将全通反变换的结果叠加至长度为P的输出缓存,输出缓存的左侧移出D个点作为输出,同时,输出缓存的右侧补充D个零,另外,将输出结果通过频率响应为一阶全通滤波器A(z)的群延迟的倒数的滤波器,得到最终的输出结果。

所述的离散傅立叶反变换可以用快速傅立叶反变换(IFFT)实现。

所述的步骤5)的P-1阶参数为b的全通反变换,可以通过P-1阶参数为-b的全通变换实现。

对于输入信号x(n)1为实信号的情况,所述的声压级检测模块3和压缩放大增益计算模块4仅需对第0至K/2通道信号进行处理。

本发明在分析过程中,先将输入信号段进行全通变换,再对变换后的信号用分析原型滤波器的时间翻转加权,时间叠加,离散傅立叶变换(可以采用快速傅立叶变换),最后乘以中心频率调整系数,得到各个通道信号。在分析过程中引入了全通变换,实现输入信号的频率的非线性变换,这样在变换后的频率尺度上的均匀通道划分相当于在原频率尺度上的非均匀通道划分。适当选择全通变换系数,可以模拟Bark频率尺度,O.Smith等在1999年给出了根据采样率选择适当全通变换参数的具体计算公式。

根据声压级检测模块的结果和各压缩放大增益计算参数,计算各个通道信号的压缩放大增益值,并将其与对应通道信号相乘。

在综合过程中,先将各通道信号乘以另一组中心频率调整系数,再做离散傅立叶反变换(可以用快速傅立叶反变换实现),将上述结果复制若干次后,用综合原型滤波器对其进行加权处理,再对加权结果进行全通反变换,将结果加在输出缓存中,输出缓存每次左侧移出D个点,作为输出。最后,将输出结果通过频率响应为一阶全通滤波器A(z)的群延迟的倒数的滤波器,得到最终的输出结果。在综合过程中,加入了全通反变换,将变换后的频率尺度,变换成原来的频率尺度,避免由分析过程中频率变换引起的综合信号的相位失真,从而保证好的信号重建效果。

本发明的优点在于,本发明中采用的模拟听觉感知模型的滤波器组结合了DFT滤波器组的高效实现方法加权叠接相加结构和全通变换,既具有加权叠接相加结构的高效率,同时克服了目前频率变换滤波器组方法中存在的无法实时实现和相位失真的问题,可以用较少的通道数目实现人耳的频率分辨率,通道数目的减少不仅可以降低计算复杂度,同时可以降低系统的群延迟。该系统的一个应用是数字助听器。

本发明设计的基于听觉感知模型的多通道宽动态范围压缩系统可以根据实际需求调节通道数目、降采样率、分析原型/综合原型滤波器的截止频率和长度、全通变换参数、各个通道压缩放大增益计算参数等参数。通过调节全通变换参数,可以实现在通道数目较少的情况下模拟听觉感知模型的信号非均匀分通道。

附图说明

图1是本发明的基于听觉感知模型的多通道宽动态范围压缩系统原理图;

图2a是全通变换参数b=0时16通道划分情况图;

图2b是全通变换参数b=0.4时16通道划分情况图;

图3是模拟听觉感知模型的分析滤波器组的流程图;

图4是全通变换原理图;

图5a是全通滤波器A(z)的相位响应图;

图5b是全通滤波器A(z)的群延迟图;

图6是模拟听觉感知模型的综合滤波器组的流程图。

图7是算法仿真所用听力图

图8a是输入信号波形图;

图8b是WOLA-64 WDRC输出波形图;

图8c是Warped WOLA-16 WDRC输出波形图;

图9a是输入信号语谱图;

图9b是WOLA-64 WDRC输出语谱图;

图9c是Warped WOLA-16 WDRC输出语谱图。

具体实施方式

如图1所示,本发明公开的基于听觉感知模型的多通道宽动态范围压缩系统包括模拟听觉感知模型的分析滤波器组2,声压级检测模块3,压缩放大增益计算模块4,乘法器5和模拟听觉感知模型的综合滤波器组6五个主要部分。输入数字信号x(n)1,经模拟听觉感知模型的分析滤波器组2后分成K个通道,声压级检测模块3检测各个通道的声压级,压缩放大增益计算模块4计算得到各个通道的具体增益值,乘法器5将通道增益值与对应子带信号相乘,所得结果通过模拟听觉感知模型的综合滤波器组6综合成一路输出信号y(n)7。

如图3所示,为了提高效率,模拟听觉感知模型的分析滤波器组2采用了加权叠接相加结构中加入了全通变换操作,调整全通变换参数,可以得到非均匀通道划分。例如,对于采样率为8kHZ,通道数目为K=16,分析原型滤波器h(n)的截止频率为π/K,图2a为全通变换参数b=0时的通道划分情况,此时为均匀滤波器组。图2b为全通变换参数b=0.4时的通道划分情况,为非均匀滤波器组。这样,可以直接对各个通道信号计算压缩放大增益。而对于基于WOLA滤波器组的宽动态范围压缩系统来说,需要先将信号分成较多数目的通道,然后将高频通道合并,以模拟听觉感知模型,之后,才能对合并后的通道进行压缩放大增益计算。

模拟听觉感知模型的分析滤波器组2具体实现流程如图3所示,实现步骤如下:

(1)长度为P的输入缓存每次右侧移入x(n)的D个点,左侧移出D个点;

(2)计算输入缓存中信号的L-1阶参数为b的全通变换;

(3)用分析原型滤波器的时间翻转h(-r)对(2)的结果加权;

(4)将(3)的结果平均分成L/K个长度为K的小片段,并将这些小片段相加;

(5)计算(4)的结果的K点快速傅立叶变换;

(6)用exp(jmDθ-1k))乘以(5)的结果,得到结果序列,其长度为K,第k个分量对应第k个通道m时刻的输出,其中,ωk=2kπ/K,k=0,...,K-1。

其中,全通变换的实现流程如图4所示。对于有限长信号s(n)13,先做时间翻转14得s(N-n),然后经过全通滤波器A(z)15链,当n=N时取值,得到变换结果。A(z)15的个数称为全通变换的阶数。其中,

A(z)=z-1-b1-bz-1,-1<b<1

为实的、稳定的、因果的一阶全通滤波器,其极点b称为全通变换参数。在单位圆上,有A(e)=ejθ(ω),其中

θ(ω)=argA(e)=ω+2tan-1(bsin(ω)1-bcos(ω)),

式中ω=2πf/fs,fs为采样率。

图4的过程实现了θ:ω→θ(ω)的非线性频率变换。由A(z)的性质可知,实现其反变换θ-1:θ(ω)→ω只要将A(z)的极点改为-b即可。

图5a显示了极点b取不同值时θ(ω)与ω之间的关系,可见当b≠0时,二者是非线性关系,对θ(ω)进行均匀通道划分,相当于对ω进行非均匀通道划分。图5b显示了极点b取不同值时A(z)的群延迟τb(ω)=(1-b2)/(1-2bcosω+b2)随ω和b变化的情况。通过对A(z)的群延迟的分析可知,当b>0时,频率越高群延迟越小,要使中包含s(k)中的所有ω=π的信息,要求序列s(k)的长度P与A(z)链长度L之间满足:L≥(1+|b|)P/(1-|b|)。而如果只要求中包含s(k)中的所有ω=0的信息,则只需满足P≥(1+|b|)L/(1-|b|)。

对于实信号,正、负频率成分是对称的,所以此时声压级检测模块(3)和压缩放大增益计算模块(4)实际上只需对第0至K/2通道信号进行处理。

如图6所示,模拟听觉感知模型的综合滤波器组6的具体步骤为:

(1)将序列乘以exp(-jmDθ-1k)),其中ωk=2kπ/K,k=0,...,K-1;

(2)计算(1)的结果的K点快速傅立叶反变换;

(3)将(2)的结果复制L/K次,形成一个长度为L的序列;

(4)用综合原型滤波器f(r)对(3)的结果加权;

(5)计算(4)的结果的P-1阶参数为-b的全通变换(即P-1阶参数为b的全通反变换);

(6)将(5)的结果叠加至长度为P的输出缓存序列,然后将输出缓存的左侧移出D个点,作为该步骤的输出,最后将输出缓存的右侧补充D个零。

(7)将(6)的输出通过频率响应为1/τb(ω)的滤波器,得到最后的输出y(n)。

为了与基于WOLA滤波器组的宽动态范围压缩系统进行对比,我们对下面的例子进行了仿真实验。

设一个听障者的听力图如图7所示。

用64通道的WOLA滤波器组(记作WOLA-64)和16通道的Warped WOLA滤波器组(记作Warped WOLA-16)对信号进行分通道,具体参数如表1所示。

表1WOLA-64和Warped WOLA-16的参数情况

  滤波器组参数  WOLA-64  Warped WOLA-16  通道数目K  64  16  降采样率D  16  4  原型分析/综合滤波器长度L  256  64

  滤波器组参数  WOLA-64  Warped WOLA-16  原型分析滤波器截止频率  π/64  π/16  原型综合滤波器截止频率  π/16  π/11  全通变换参数b  无  0.5657

对WOLA-64高频通道进行适当合并,得到这两个滤波器组对应于正频率的9个通道的中心频率和带宽情况如表2所示。

表2WOLA-64和Warped WOLA-16的中心频率和带情况

根据听阈图(图7)设计相应通道的WDRC参数如表3所示。

表3各通道的WDRC参数

  通道序号  1,2  3  4  5,6  7,8  9  启动时间(ms)  5  5  5  5  5  5  恢复时间(ms)  70  70  70  70  70  70  下拐点(dB)  50  50  50  50  50  50  上拐点(dB)  100  100  100  100  100  100  50dB增益(dB)  20  25  30  35  40  45  80dB增益(dB)  10  10  15  17  22  25  压缩比  1.5∶1  2∶1  2∶1  2.5∶1  2.5∶1  3∶1

测试信号为女声“school”,采样率为16kHz,其波形如图8a所示,语谱图如图9a所示。Warped WOLA-16和WOLA-64 WDRC系统的输出波形分别为图8b和图8c。图9b和图9c分别为WOLA-64WDRC系统输出和Warped WOLA-16 WDRC系统输出的语谱图。从上述图像的比较可以看出,Warped WOLA-16 WDRC系统和WOLA-64 WDRC系统具有相似的压缩放大效果。

考察数字助听器的信号处理算法的重要指标有频率分辨率、计算复杂度和系统群延迟。从上面的分析可以看出,WOLA-64 WDRC和Warped WOLA-16 WDRC系统在获得相似频率分辨率的前提下,后者具有通道数目更少的优势。另外,WOLA-64延迟为272个采样点,而Warped WOLA-16的延迟为234个采样点。这是因为通道数目的减少可以降低对分析/综合原型滤波器长度的要求,从而降低滤波器组的延迟。滤波器组的延迟是WDRC系统群延迟的重要组成部分,因此Warped WOLA-16WDRC系统具有更小的群延迟。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号