首页> 中国专利> 用于计算回声抑制滤波器的控制信息的装置和方法、用于计算延迟值的装置和方法

用于计算回声抑制滤波器的控制信息的装置和方法、用于计算延迟值的装置和方法

摘要

一种用于计算抑制滤波器(210)的控制信息的装置(200),所述抑制滤波器用于对第二音频信号进行滤波,以抑制基于第一音频信号的回声,所述装置(200)包括:计算装置(220),包括值确定装置(230),所述值确定装置(230)用于为信号组中的至少一个信号的至少两个在时间上连续的数据块的带通信号确定至少一个与能量相关的值。所述计算装置(220)还包括均值确定装置(250),用于确定为所述带通信号确定的至少一个与能量相关的值的至少一个均值。所述计算装置(220)还包括修正装置(260),基于为所述带通信号确定的均值来对所述带通信号的至少一个与能量相关的值进行修正。所述计算装置(220)还包括控制信息计算装置(270),基于至少一个修正后的与能量相关的值来计算抑制滤波器(210)的控制信息。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-03-27

    授权

    授权

  • 2011-03-16

    实质审查的生效 IPC(主分类):H04M9/08 申请日:20090112

    实质审查的生效

  • 2011-01-19

    公开

    公开

说明书

技术领域

本发明的实施例涉及用于计算抑制滤波器的控制信息的装置和方法、用于抑制滤波的装置和方法以及用于计算延迟值的装置和方法,例如可以用于会议系统、通信系统和可能出现声学回声的其他系统。

背景技术

例如,当来自扬声器的音调、声音和噪声被相同房间内或相同声学环境内的麦克风拾取时,将出现声学回声。在电信系统中,回声被作为声学反馈信号发送回位于远端或另一端的用户,该用户注意到这是其自己的话音的延迟版本。这里,回声信号表现为一种扰乱的干扰,甚至可能损害交互式的双向全双工通信。此外,声学回声也可以导致啸声效应(howling effects)和声学反馈环路的其他不稳定性。

这里,与提供给对应扬声器的扬声器信号相比,麦克风拾取的麦克风信号有所不同,这种不同一方面是由其中布置有麦克风和扬声器的声学环境导致的,另一方面是由源自最多样的物理源的噪声源导致的。除了声学环境的噪声源之外,扬声器本身、相关电路、麦克风和与其相关的其他电路(仅作为潜在源中的一些而提出)可能将噪声耦合入麦克风信号。

这里,静态或准静态噪声在麦克风信号中的出现可能显著影响系统可实现的音频质量。

WO 2006/111370A1涉及一种用于去除多声道音频信号中的回声的方法和装置。对于每个免提电信系统,如电话、音频或视频会议系统,声学回声控制和噪声抑制是其重要部分。这里也要考虑带宽限制和关于计算复杂度的限制。这里,在该文献中描述的用于处理多声道音频扬声器信号和至少一个麦克风信号的方法包括以下步骤:将输入麦克风信号变换为输入麦克风短时频谱;根据扬声器信号来计算组合扬声器信号的短时频谱;根据输入麦克风信号来计算组合麦克风信号的短时频谱;估计组合麦克风信号的短时频谱中回声的幅度谱或功率谱;计算用于对输入麦克风短时频谱进行幅度修正的增益滤波器;将该增益滤波器应用至至少一个输入麦克风频谱;以及将滤波后的输入麦克风频谱转换至时域。

基于该现有技术,本发明的目的是在与噪声部分相关的回声抑制的范围内提高声学系统的音频质量。

这个目的是通过根据权利要求1所述的装置、根据权利要求20所述的抑制滤波器、根据权利要求21或22之一所述的方法或根据权利要求32所述的程序来实现的。

在其他信号处理电路中,噪声对使用信号处理电路来处理的相应分量的性能也有负面影响,不论该分量是模拟的还是数字的,是电信号还是光信号。具体地,这里一方面考虑从所关心的信号获取信息的信号处理电路,另一方面考虑基于所获取的信息来影响原始信号的信号处理电路。

例如,这样的信号处理电路的示例是延迟电路,其中从两个信号的对应比较来导出延迟值。这里,在一个或更多所关心的信号中存在噪声部分将使所关心的信号处理电路的性能显著下降。因此,例如在延迟电路的范围内,延迟值对另一信号波形的对应适配可能在其质量以及其适配速度方面受到噪声的负面影响。

这里,基于该现有技术,本发明的另一目的是提供延迟装置的延迟值计算方面的改进,允许改进的延迟值计算。

这个目的是通过根据权利要求23的用于计算延迟值的装置、根据权利要求31的用于计算延迟值的方法或根据权利要求32的程序来实现的。

发明内容

这里,用于计算抑制滤波器的控制信息的装置的实施例包括计算装置,所述抑制滤波器用于对第二音频信号进行滤波,以抑制基于第一音频信号的回声。所述计算装置本身包括值确定装置,用于为信号组中的至少一个信号的至少两个在时间上连续的数据块的带通信号确定至少一个与能量相关的值。这里,所述信号组包括第一音频信号、第二音频信号和从第一或第二音频信号导出的信号。所述计算装置还包括均值确定装置,用于确定所述带通信号的至少一个确定的与能量相关的值的至少一个均值。所述计算装置还包括修正装置,基于所述带通信号的确定的均值来对所述带通信号的至少一个与能量相关的值进行修正。所述计算装置还包括控制信息计算装置,基于所述带通信号的至少一个修正后的与能量相关的值来计算抑制滤波器的控制信息。

采取抑制滤波器形式的本发明的实施例包括计算装置,所述抑制滤波器用于对第二音频信号进行滤波,以抑制基于第一音频信号的回声,所述计算装置本身包括值确定装置,用于为信号组中的至少一个信号的至少两个在时间上连续的数据块的带通信号确定至少一个与能量相关的值。所述信号组包括第一音频信号、第二音频信号和从第一或第二音频信号导出的信号。所述计算装置还包括均值确定装置,用于确定所述带通信号的至少一个确定的与能量相关的值的至少一个均值。所述计算装置还包括修正装置,基于所述带通信号的确定的均值来对所述带通信号的至少一个与能量相关的值进行修正。此外,所述计算装置还包括声学抑制滤波器装置,基于控制信息来对麦克风信号进行滤波,所述控制信息至少基于所述带通信号的至少一个修正后的与能量相关的值。

采取用于计算延迟装置的延迟值的装置的形式的本发明的实施例包括计算装置,所述延迟装置用于相对于第二信号来延迟第一信号,所述计算装置本身包括值确定装置,用于为第一和第二信号的至少两个在时间上连续的数据块的第一信号和第二信号的带通信号确定至少一个与能量相关的值。所述计算装置还包括均值确定装置,用于确定所述第一信号和第二信号的带通信号的至少一个确定的与能量相关的值的至少一个均值。所述计算装置还包括修正装置,基于所述第一信号和第二信号的带通信号的确定的均值来对所述第一信号的带通信号和所述第二信号的带通信号的至少一个与能量相关的值进行修正。此外,所述计算装置还包括延迟值计算装置,被形成为基于第一和第二信号的修正后的与能量相关的值来计算延迟值。

本发明的实施例基于以下发现:通过对带通信号的至少一个与能量相关的值的均值进行修正,之后再基于至少一个修正后的与能量相关的值来确定抑制滤波器和/或抑制滤波的控制信息,可以实现针对噪声源来提高用于回声抑制的系统中的音频质量。尤其由于对带通信号的与能量相关的值的平均和修正是这样一种可能的对噪声分量的考虑(在相应的瞬时值(延伸值)方面,噪声分量包括在时域中为零的统计均值),而且由于带通信号的与能量相关的值具有不同于零的均值也是对噪声分量的考虑。

通过基于伴随的均值来对与能量相关的值进行平均和修正,可以在计算抑制滤波器的控制信息之前和/或在实际进行抑制滤波之前,从实际有用的信号中分离静态虚假信号。因此,尤其在本发明的一些实施例中,与现有的噪声分量相比,可以将抑制滤波器和/或伴随的控制信息集中在实际有用的信号上。

这里,在本发明的实施例中,与能量相关的值可以与实数值的正整数指数次幂成比例。类似地,与能量相关的值可以与幅度(绝对值)的正实数指数次幂成比例。因此,在本发明的实施例中,与能量相关的值可以是能量值(幅度的平方),或与能量值成比例的值。这里,第一音频信号可以是扬声器信号,第二音频信号可以是麦克风信号。

在本发明的实施例中,因此,值计算装置也可以被形成为:针对相同数据块、但具有不同特征频率的不同带通信号,确定多个与能量相关的值。这里,一般而言,带通信号是频谱、与频率相近或与频率相关的信号,至少一个特征频率与其相关联。例如,这些特征频率可以是中心频率、起始频率、终止频率或其他典型频率。因此,带通信号的示例表示傅立叶解析滤波器组的频谱信息、子带或部分频带信号、有限频率范围内的信号或也可以是QMF(正交镜像滤波器)信号。

在本发明的实施例中,不仅对单独的带通信号,而且对多个对应的带通信号,或也可以对所有带通信号来计算以下每一个:相关带通信号的对应的与能量相关的值、相关的时间平均的均值和考虑相应均值的对应数目的修正后的与能量相关的值;在计算声学抑制滤波器的控制信息或直接进行声学抑制滤波时可以使用这些值。

在本发明的实施例中,可以基于滑动平均来执行均值计算。这里,根据实施例的具体实现,除了当前数据块以外,滑动平均或平均还可以仅基于在时间上位于当前数据块之前的数据块。因此,例如,可以实现实时平均。

在本发明的另外实施例中,基于从相关的与能量相关的值中减去均值来执行修正。本发明的实施例也包括另外的滤波器单元或延迟装置,其中,延迟装置被形成为利用延迟值对信号、波形或值的时间序列(如与能量相关的值的时间序列)进行延迟。这里,基于修正后的与能量相关的值、未修正的与能量相关的值或其他值来确定所述延迟值。

这里,本发明的实施例也基于以下发现:通过确定第一信号和第二信号的至少一个带通信号的与能量相关的值,对其求平均,并基于所确定的均值来相应地对其进行修正,可以实现对延迟装置的延迟值的计算的改进。这里,在所关心的带通信号下的频率范围中,或在该带通信号下的特征频率中,可以消除与能量相关的值中表现为零点偏移影响的噪声部分或静态信号部分。由于基于与能量相关的值并针对带通信号来执行相应修正,可以消除以与对应频率相关的噪声信号的形式出现的干扰,该干扰在时间平均中基本消失。

对于延迟值的计算,其可以确定延迟值,在该延迟值的帮助下,通过实现本发明的实施例,可以可以更快、更可靠、或更快而且更可靠地实现例如第一和第二信号的波形的适配。

附图说明

参照附图,以下将更详细地解释本发明的实施例。

图1示出了用于示意回声去除中的基本问题的示意图;

图2示出了根据本发明实施例的用于计算声学抑制滤波器的控制信息的装置的电路框图;

图3示出了用于更详细描述本发明的实施例的功能的简化框图;

图4示出了根据本发明的另一实施例的电路框图;

图5示出了图4所示的本发明实施例的延迟值计算装置的电路框图;

图6a示出了1000Hz处的扬声器信号的短时频谱的时间过程及其时间平均值;

图6b示出了各种回声估计滤波器的比较;

图6c示出了回声可预测性增益因子的时间过程;

图7示出了根据本发明的另一实施例的框图;

图8示出了根据本发明的实施例的框图;

图9示出了根据本发明的实施例的用于计算声学抑制滤波器的控制信息的装置的框图;

图10示出了根据本发明的实施例的用于针对若干声道来计算声学抑制滤波器的控制信息的装置的框图;

图11示出了根据本发明的实施例的另一声学抑制滤波器的框图;

图12示出了对频率组中的匀短时傅立叶变换滤波器组进行分组;

图13a示出了Hann插值滤波器的过程;

图13b示出了作为频率的函数对增益滤波器组系数的比较;以及

图14示出了用于计算延迟值的装置的实施例的电路框图。

具体实施方式

在结合图2至14来详细解释本发明的各种实施例之前,首先结合图1来更详细的解释回声去除中的基本问题。

例如,任何时候当来自扬声器的音调、声音或噪声被相同房间内或相同声学环境内的麦克风拾取时,将出现声学回声。在电信系统中,回声被作为声学反馈信号发送回远端用户,该用户注意到这是其自己的话音的延迟版本。在这样的环境下,回声信号表现为一种非常扰乱的干扰,甚至可能导致交互式的双向全双工通信被阻断。此外,声学回声可以导致啸声效应和声学反馈环路的其他不稳定性。

因此,在全双工免提电信系统中,回声控制通常是可取的,以抑制、衰减或去除扬声器与麦克风之间的耦合。图1示出了这种声学回声问题。

图1示出了在声学环境120(例如可以是房间)中扬声器100和麦克风110的布置。这里,向扬声器100提供扬声器信号130(在图1中也称为x[n]),扬声器100将其转换为声学声波。这里,索引n是指扬声器信号x[n]的离散过程的时间索引。这里,索引n是整数。

麦克风110拾取入射到其上的声波,并将其转换为麦克风信号140(在图1中也称为y[n])。这里,特别地,麦克风110也拾取源自扬声器100、从扬声器100经由不同路径到达麦克风110的扬声器信号x[n]的声学波。除了直接传输路径150之外,在图1中还示意性且示例性地绘出了两个间接传输路径160-1和160-2,在这两个间接传输路径中,扬声器100的声波在声学环境120处被反射,因此只能间接地到达麦克风110。因此,传输路径160也被称为间接路径。

因此,如果在扬声器100处可用的扬声器信号x[n]是远端电信系统用户的话音信号(所谓的远端信号),则麦克风110也拾取该远端信号。换言之,基于扬声器100的发射,该远端信号经由直接和间接或反射路径或传输路径150、160到达麦克风110。因此,麦克风110不仅拾取电信系统的近端的本地话音,也拾取回音,然后将回音反馈给远端用户。

为了控制这一问题,电信系统通常包括回声抵消处理电路或回声抑制处理电路,以下也总称为回声去除处理电路或回声去除处理单元170,如同样在图1中示出的,向回声去除处理单元170提供了麦克风信号y[n]和扬声器信号x[n]。然后,回声去除处理单元170输出回声去除的或回声部分去除的或回声部分抵消的信号e[n]。

图1示出了该声学回声去除问题的基本构成。将扬声器信号x反馈入麦克风信号y。回声去除过程去除该回声,同时理想地允许在通信系统的本端产生的本地话音通过。

处理这些回声的一种传统方法是将声学回声抵消器(AEC)与回声信号的传播路径150、160并行放置,参考文献[1]中也描述了该方法。在声学回声去除器中,对回声信号的数字副本进行估计,然后从测量的麦克风信号中减去该副本。用于声学回声抵消的标准方法依赖于以下假设:可以使用线性FIR(有限冲激响应)滤波器来对回声路径(传输路径150、160的整体系统)进行建模,以便相应地实现声学回声抵消,这也在[1]中进行了描述。FIR滤波器也被称为具有有限长度的冲激响应的滤波器。

这里,由多个参数给出回声路径,包括扬声器100的特性、麦克风110的特性和声学环境120的特性,以及其他对象的属性和特征。例如,特别考虑由日照或其他热源(仅列出一些可能的偏差源)导致的空气的温度变化和温度梯度。

由于回声路径是未知的,而且在操作期间可变,因此,自适应地实现声学回声抵消的线性滤波器是可取的。因此,为了对典型回声路径进行建模,通常实现(而且也部分需要)长度高达数百毫秒的FIR滤波器,这意味着较高的计算复杂度。这里,在滤波器中实现的滤波器系数的数目被称为FIR滤波器(即具有有限冲激响应的滤波器)的长度。这里,以及在其他相应参数中,如果以秒、毫秒或其他时间单位来表示实际上表示无量纲数量的相应数或相应值,则其涉及数字信号处理或相应地使用的模拟/数字转换器和数字/模拟转换器中所利用的采样率(采样频率)。

然而,实际上,这些传统方法可实现的回声衰减不够高,这是由于回声的长回响时间(回声拖尾效应)、非线性回声分量和收敛问题。上述回声拖尾效应通常由回声路径的建模不足(undermodeling)而导致,而非线性回声分量是由振动效应或低成本或廉价的音频硬件组件的非线性性态而导致。例如,上述收敛问题出现在高度时变回声路径的情况下。在参考文献[2]中阐述了该情况的细节。

出于这种原因,可能必须将声学回声抵消器与非线性后处理器组合,以去除回声抵消器无法消除的残留回声。在参考文献[3]中可以找到关于这方面的详细描述。通常,如在参考文献[4]中所述,以频率选择性的方式来执行残留回声的抑制。确实,几乎所有的声学回声抵消器使用这样的后处理器,这是由于它们通过不能充分减少回声以使其变为不可听见。

近来,提出了多种在子带范围中操作的声学回声抑制器,如参考文献[5]和[6]所述,这些抑制器与上述非线性后处理器类似,但不需要声学回声抵消器,且不需要估计回声路径的冲激响应。据称,这些系统具有低计算复杂度并且是鲁棒的,同时能够实现高度的双工性。

参考文献[6]中提出的回声抑制方案应用短时傅立叶变换(STFT)来计算扬声器和麦克风信号的频谱。选择通过STFT来变换的扬声器信号的结果之间的延迟或延迟值d,以便考虑大多数回声冲激响应。然后,对用于模仿回声路径的部分的效应的实数值回声估计滤波器进行估计。为了获得回声幅度谱的估计,对扬声器信号频谱应用估计的延迟值和回声估计滤波器。使用回声幅度谱的估计,计算实数值回声抑制滤波器,并将其应用至麦克风信号频谱以抑制回声。

然而,上述声学回声抑制(AES)系统的缺点在于,其不能以令人满意的方式来处理麦克风信号中的静态噪声。如随后的解释将要示出的,静态噪声产生回声估计中的成分(偏置),如果所关心的信号的信噪比不是非常高,则该成分(偏置)将使这种系统的性能退化。根据该实现方式或模型,该成分也被称为对期望估计的偏差、零点偏移或系统性估计偏差。

图2示出了用于计算声学抑制滤波器210的控制信息的装置200的电路框图,在图2中以虚线将滤波器210表示为可选组件。这里,装置200包括计算装置220,计算装置220继而包括值确定装置230,其输入耦合至装置200的输入240。均值确定装置250一方面耦合至值确定装置230的输出,值确定装置230的输出以与该耦合并行的方式耦合至修正装置260的第一输入。均值确定装置250的输出耦合至修正装置260的第二输入。修正装置260经由其输出耦合至控制信息计算装置270的输入,控制信息计算装置270在其输出处输出并提供声学抑制滤波器210的控制信息,其输出同时也是装置200的输出。

至此,声学抑制滤波器210包括用于控制信息的输入。根据其中实现装置200和声学抑制滤波器210的系统的具体实现方式,在输入240处提供的信号也可以在输入侧被提供给抑制滤波器210。然而,此外,附加地或备选地,也可以在可选输入280处向其提供另外的信号。对按照这种方式提供给声学抑制滤波器210的一个或两个信号(考虑提供给抑制滤波器210的控制信息)进行滤波,并在输出290将其输出。

关于用于计算声学抑制滤波器210的控制信息的装置200的功能,在输入240向其提供至少一个信号,该信号可以是上述扬声器信号、上述麦克风信号或从其一或两者导出的信号。如以下仍要更详细解释的,当然也可以向装置200提供多于一个的信号。

这里,提供给装置200的信号包括在时间上连续的数据块(也被称为帧)。在本发明的实施例中,下游装置和单元每个对一个或更多数据块进行操作,其中,在对若干数据块进行操作的情况下,对于数据块的时间序列而言,附加地考虑过去的数据块。这反映了根据本发明的实施例的装置200的一种典型应用场景,装置200通常用于允许或实现实时的相应的回声抑制。

如果在输入240处向装置200提供相应信号,则至少一个相应数据块到达值确定装置230,值确定装置230继而计算至少一个带通信号的与能量相关的值。这里,带通信号是与频率相关的信号,例如由解析傅立叶滤波器组、子带解析滤波器组或也可以由QMF解析滤波器组来提供。

这里,特征频率与每个带通信号相关联,该特征频率表示较低的起始频率、较高的终止频率、中心频率或其他典型频率。例如,如果带通信号是傅立叶解析滤波器组的频谱值,则所关心的频谱值下的频率可以被认为是特征频率。在包括更大频率范围的频率部分的子带或QMF信号的情况下,特征频率可以是上述典型频率之一。

根据本发明的实施例的装置200的具体实现方式,值确定装置230也可以基于由时间索引唯一可标识的相同数据块,输出多于一个带通信号的多于一个的与能量相关的值。因此,例如,可以为多个或所有子带信号确定对应的与能量相关的值。

例如,与能量相关的值可以是所关心的带通信号的能量值或与其成比例的值。类似地,如果作为底的值是实数值,则与能量相关的值可以是与所关心的带通信号的值的正整数指数次幂成比例的值。可选地或附加地,与能量相关的值可以与所关心的带通信号的幅度(绝对值)的正实数指数次幂成比例。例如,这样也允许使用复数值作为底。

现在,将针对至少一个带通信号所确定的与能量相关的值提供给均值确定装置250,均值确定装置250被形成为确定至少一个相应均值。在向均值确定装置250提供每数据块多于一个与能量相关的值的本发明的实施例中,可以仅对多个所关心的值确定这样的均值,或对每个所关心的值确定这样的均值。

如在其他过程中将要解释的,这里,可以基于滑动平均来执行均值确定,例如,除当前数据块之外,所述滑动平均还基于时间上在前的数据块或多个数据块。例如,这可以通过分别考虑不同数据块的各自的值来执行,或以递归计算的形式来执行。在其他过程中仍将解释具体实现。

现在,将值确定装置230的至少一个与能量相关的值和均值确定装置250的至少一个均值提供给修正装置260,修正装置260基于为所关心的带通信号确定的均值来修正与能量相关的值。在本发明的不同实施例中,例如,可以通过简单的减法、通过简单的除法或基于减法或除法的更复杂的数学运算来进行该修正。

因此,修正装置260产生一个或更多修正后的与能量相关的值,基于此,下游的控制信息计算装置270现在计算声学抑制滤波器210的控制信息。

根据在装置200的输入240处所提供的信号,经由可选的另外的输入280向声学抑制滤波器210提供相同的信号或提供其他信号是可取的。例如,如果在输入240处提供的信号是麦克风信号,则可以省略声学抑制滤波器210的另外的输入280的实现。然而,如果在输入240处提供的信号是扬声器信号,则实现另外的输入280并向其提供麦克风信号确实是可取的。

上述进一步描述的传统声学回声抑制系统的缺点在于,它们不能很好地处理麦克风信号中的静态噪声。通过实现本发明的实施例,可以至少部分地、也可能完全改进与上述缺点相关的音频质量方面的缺点。如在其他过程中还要示出的,静态或准静态噪声导致关于回声估计的系统性估计偏差,在信噪比(SNR)不是非常高的场景中,这将使这些系统的性能恶化。

本发明的实施例确实开创了一种新技术,以解决并至少部分消除相应的声学回声抑制系统的上述缺点。图2所示的本发明的实施例尤其允许基本实现用于估计回声估计滤波器的技术,其中减轻了由于噪声的存在而导致的系统性估计偏差的问题。

因此,本发明的实施例涉及回声估计滤波器的计算。这是基于从扬声器频谱的时间波动开始对麦克风频谱的时间波动的估计。因此,本发明的实施例允许对回声估计滤波器的更正确的估计,而不会由麦克风声道中可能的加性噪声引入系统性估计偏差。因此,本发明的实施例允许基于频谱成分的波动来实现回声估计滤波器。

在本说明书的其他过程中对本发明的另外的实施例进行更详细的解释并更详细地讨论其功能之前,要指出的是,假定互相耦合的两个组件是指直接连接或经由相应的连接装置、信号路径或其他通信方法来间接连接的组件。因此,上述装置230、250、260和270都被实现在计算装置220的框架内。

这里,单独的装置不必须由分离的电路模块来实现。因此,确实可能出现以下情况:计算装置220中属于多于一个的上述装置的电路组件部分或完全重叠。例如,如果计算装置220是处理器,则在不同装置中可以至少部分地使用相同的电路。因此,例如,值确定装置230以及修正装置260中可以采用ALU(算术逻辑单元)的相同部分。在这种情况下,例如,可以经由存储器中的存储位置来实现相应装置230、260的耦合。

此处也要指出,以下使用相似或相同的参考标号来表示功能相同或功能相似的装置、单元和对象。相同、相似、功能相同或功能相似的装置、对象和单元也使用相同或相似的参考标号。出于这种原因,说明书中涉及使用相同或相似参考标号来表示对象、装置和单元的段落可以在本发明的各个实施例之间转移,这允许在不使用不必要的重复的情况下,能够更准确清楚地示意各种实施例。

在本说明书的其他过程中使用的概括性的参考标号也算作类似的参考标号。如果装置、对象和元件在一幅图中出现多次,或在本发明的一个实施例中出现多次,或在其他环境下出现多次,则将使用单独的参考标号来表示单独的对象、装置和元件,而在对所有相应装置、对象和单元的总体特征和属性进行描述、陈述或讨论时,将使用伴随的概括性参考标号。因此,例如,概括性参考标号160用于两个间接交叠路径160-1和160-2。在许多其他情况下,除非从相应装置、对象和元件的描述中能够得到任何相反的内容,否则概括性参考标号的使用指示了所表示的相应装置、元件和单元包括相同或相似的功能或结构特征的事实。

回声抑制系统的关键部分是回声信号的幅度或功率谱的正确估计,以使得可以计算有效的回声抑制滤波器。在参考文献[6]中,在回声估计滤波器的帮助下,通过对正确延迟后的扬声器幅度谱进行滤波来估计回声幅度谱。

然而,首先说明,只要麦克风信号中存在噪声,参考文献[6]中的回声估计滤波器的计算将导致系统性估计偏差。然后,提出了一种方法来计算回声估计滤波器,即使在信号中存在噪声的情况下,该方法也(几乎)总是不产生系统性估计偏差。如图3所示,通过基于信号频谱的波动来估计回声估计滤波器,能够解决系统性估计偏差的问题。

图3示出了装置200的简化电路框图,装置200用于计算声学抑制滤波器以及未直接在图3中实现而作为更大电路的一部分的相应声学抑制滤波器的控制信息。图3所示的电路框图是其中未示出所有组件的简化图。基于图3,仅解释根据本发明实施例的装置和/或根据本发明实施例的相应声学抑制滤波器的基本功能。

因此,图3再次示出了重现扬声器信号x[n]的扬声器100。将该扬声器信号提供给单元300。此外,图3也示出了向单元300提供麦克风信号y[n]的麦克风110。

相对于图2所示的实施例中包括值确定装置230和均值确定装置250,图3所示的单元300略有不同。因此,图3中的单元300包括针对时间波动的两个估计装置310-1和310-2,在图3中也表示为ETF(时间波动的估计)。这里,估计装置310-1的输入侧耦合到扬声器100,而估计装置310-2的输入侧耦合到麦克风110。

这里,两个估计装置310至少对扬声器信号和麦克风信号中包括的带通信号执行如结合图2所描述的值确定装置230和均值确定装置250的功能特征和属性。因此,图3所示的装置200的实施例表示的实施例中,不仅处理信号组中的单个信号,而且至少处理两个信号,即扬声器信号和麦克风信号。因此,在图3所示的实施例中,两个估计装置310确定相应带通信号的两个信号的与能量相关的值以及伴随的均值。

两个估计装置310中每一个的输出耦合至回声估计滤波器320的相应输入,回声估计滤波器320包括与图2所示的实施例的描述相关的修正装置260和控制信息计算装置270。相应地,回声估计滤波器320基于两个信号x[n]、y[n]的与能量相关的值以及伴随的均值来执行结合图2所描述的两个装置260和270的功能。

图3中的装置200还包括回声抑制处理单元或回声抑制处理电路325(ERP=回声去除处理),在图3中也将其称为回声抑制,其包括图2中的声学抑制滤波器210的功能。因此,回声估计滤波器320也包括相应的控制信息输入,向该输入提供由回声估计滤波器320提供的控制信息。

如同声学抑制滤波器一样,回声抑制处理单元325也接着基于向其提供的信号来产生声学信号e[n],该声学信号e[n]基于麦克风信号y[n]并关于扬声器100产生的回声进行了至少部分校正。这一步骤通常也被称为频谱修正,这是声学抑制滤波器210(图3中未示出)和回声抑制处理单元325两者被称为频谱修正的原因,因为其至少在本发明的一些实施例中在基于频率的域中操作。具体地,关于回声抑制处理单元325,额外参考对图7的描述。

因此,图3示出了回声估计滤波器的所提出的估计的电路框图,其中图3中所使用的缩写ETF和EEF分别代表时间波动的估计和回声估计滤波器。

为了更好地理解本发明的实施例的功能,现在参照附图,基于信号模型来对其他功能进行更详细的描述。以下,这里假定可以将图1中的声学环境中的声学回声路径cn表示为直接传输路径或直接传播路径与线性滤波器gn的影响的组合。这里,直接传播路径与扬声器信号和麦克风信号的v个样本延迟值的延迟相对应。这里,线性滤波器gn对环境的声学属性进行建模。因此,获得了:

cn=gn*δ[n-v],(1)

其中δ[n]表示单位冲激,*表示(数学)卷积。假定只有远端说话者是活动的,麦克风信号y[n]的时域模型由以下给出:

y[n]=gn*x[n-v]+w[n],(2)

其中n还是表示与离散时间过程的采样值相关的时间索引的整数。因此,等式(1)和(2)中出现的变量n是时域中的索引。

在等式(2)中,这里,表达式gn*x[n-v]表示由麦克风拾取的经过延迟和滤波后的扬声器信号。这里,成分w[n]表示记录区中存在的静态背景噪声。通过对等式(2)的两端进行相应的时频变换,即例如短时傅立叶变换(STFT),获得了:

Y[k,m]=G[k,m]Xd[k,m]+W[k,m],(3)

其中k是整数并以数据块编号(帧编号)的形式来表示数据块,其中,m是频率索引,即也是整数。这里,根据

Xd[k,m]:=X[k-d,m],(4)

频域或STFT域中相应延迟的扬声器信号为x[n-v],其中这里假定在当前情况下v是数据块偏移(帧偏移或样本提前值)K的整数倍。换言之,这里假定适用以下等式:

v=dK    (5)

其中v、d和K是对应的整数。这里,等式(5)仅表示一种允许在标记上略微简化的假定,而并不表示后续等式或其技术实现的有效性的严格先决条件。在本说明书的其他过程中,如果提及信号的延迟或数值的频率,无需严格考虑等式(5)。

再换言之,在本发明的一些实施例中,将连续的、采样的声学数据流划分为时域中长度为K的数据块。当然,在其他实施例中,数据块也可以包括比所关心的数据流被偏移的值更多数目的值。例如,这可以通过交叠来实现。

此外,使用等式(3)中的表示G[k,m]作为滤波器gn和/或其冲激响应的伴随表示。相应地,W[k,m]表示静态背景噪声w[n]在频域中的表示。实际上,可以合理假定x[n]与w[n]不相关,使得根据等式(3),有:

E{|Y[k,m]|2}=E{|G[k,m]|2·|Xd[k,m]|}+E{|W[k,m]|2},(6)

其中E{}表示数学期望值或均值(例如算术均值)。作为等式(6)的一种瞬时近似,可以以功率谱|Y[k,m]|2的形式将其写为:

|Y[k,m]|2≈|G[k,m]|2·|xd[k,m]|2+|w[k,m]|2.(7)

基于这种信号建模,结合图4和5,以用于计算声学抑制滤波器210的控制信息的装置200的形式来描述本发明的其他实施例。这里,图4和5示出了电路框图,其中图5示出了可以在图4所示的实施例中使用的延迟计算装置的电路框图。

图4示出了用于计算声学抑制滤波器210的控制信息的装置200的电路框图。这里,将装置200和声学抑制滤波器210均实现为计算装置220的一部分,计算装置220可以是处理器或CPU(中央处理单元)。

这里,装置200包括第一输入240-1和第二输入240-2,其中提供第一输入240-1和第二输入240-2分别用于时域中的扬声器信号和时域中的麦克风信号。时间/频率变换装置330-1耦合至第一输入240-1,时间/频率变换装置330-1可以是例如:短时傅立叶解析滤波器组、傅立叶解析滤波器组、子带解析滤波器组或也可以是QMF解析滤波器组。延迟装置340耦合在时间/频率变换装置330-1的输出处,延迟装置340被形成用于以延迟的方式来转发从时间/频率变换装置330-1提供的信号。

在图4所示的实施例中,延迟装置340的输出侧耦合至值确定装置230,值确定装置230包括用于扬声器信号的第一值确定子装置230a。然后,值确定装置230耦合至均值确定装置250,均值确定装置250继而包括均值确定子装置250a,均值确定子装置250a耦合至延迟装置240的输出和值确定子装置230a的输出。均值确定装置250以及均值确定子装置250a在其输出耦合至修正装置260的修正子装置260a的输入。这里,修正子装置260a经由另外的输入耦合至值确定子装置230a的输出,使得除了确定的均值之外,原始值也对修正子装置260a可用。

除了该用于扬声器信号的第一路径之外,装置200还包括第二路径,该第二路径耦合至用于麦克风信号的第二输入240-2。更具体地,这里,第二时间/频率变换装置330-2的输入侧耦合至第二输入240-2。然后,其输出侧耦合至第二值确定子装置230b,第二值确定子装置230b也被实现为值确定装置230的一部分。均值确定装置250还包括用于麦克风信号的均值确定子装置250b,均值确定子装置250b的输入侧耦合至时间/频率变换装置330-2的输出和第二值确定子装置230b的输出。如同均值确定子装置250a一样,均值确定子装置250b耦合至修正装置260的输入。这里,均值确定子装置250b耦合至第二修正子装置260b,第二修正子装置260b也是修正装置260的一部分。这里,修正子装置260b经由另外的输入耦合至值确定子装置230b的输出,使得除了确定的均值之外,原始值也对修正子装置260b可用。

在图4所示的实施例中,通过其两个修正子装置260a、260b,修正装置260本身耦合至控制信息计算装置270的输入,控制信息计算装置270包括串联连接的用于实际控制信息的估计装置350和计算装置360。在图4所示的装置200的实施例中,计算装置360还耦合至值确定子装置230b和延迟装置340的输出。

向声学抑制滤波器210提供从计算装置360提供的控制信号以及在第二时间/频率变换装置330-2中被变换至频域或与频率相近的域的麦克风信号,该控制信号包括控制信息,基于这些信号,声学抑制滤波器210产生频域或与频率相近的域中的回声抑制后的信号,并对该信号执行频谱修正。然后,将频域或与频率相近的域中的修正的信号发送至频率/时间变换装置370,频率/时间变换装置370执行向时域的反变换。频率/时间变换装置370的输出侧耦合至装置200的输出290,在输出290处,在时域中提供回声抑制或回声减小后的麦克风信号——与图2所示的实施例不同。

此外,图4所示的装置200的实施例还包括延迟值计算装置380,其输出耦合至延迟装置340的输入(控制输入),延迟值计算装置380经由该输出将当前延迟值或延迟值的当前校正值发送至延迟装置340。这里,延迟值计算装置380耦合至用于扬声器信号和麦克风信号的路径中的每个路径。

根据具体实现方式,可以在不同位置执行这种与两个路径的耦合,这两个路径仅在修正装置260之后会合。因此,例如,延迟值计算装置380可以耦合至第一时间/频率变换装置330-1的输出、延迟装置340的输出或修正装置260中的第一修正子装置260a的输出。此外,对于麦克风信号路径,延迟值计算装置380可以耦合至第二时间/频率变换装置330-2的输出或修正装置260中的第二修正子装置260b的输出。

图5示出了例如可以在图4中采用的延迟值计算装置380的电路框图。这里,延迟值计算装置380包括第一输入390-1和第二输入390-2,其中之一耦合至图4所示的实施例中的扬声器信号路径,而其中另一个耦合至麦克风信号路径。因此,例如,对于扬声器信号路径,第一输入390-1可以耦合至延迟装置340的输出,而第二输入390-2耦合至第二时间/频率变换装置330-2的输出。

延迟值计算装置380包括耦合至两个输入390的相干函数计算装置400。相干函数计算装置400被形成为基于在两个输入390处输入的信号来计算相应的相干函数。相干函数计算装置400的输出侧耦合至下游的回声预测增益计算装置410,回声预测增益计算装置410被形成为计算相应的回声预测增益并将其输出至优化装置420。然后,该优化装置420耦合至延迟值计算装置380的输出430,该输出430本身耦合至图1中的延迟装置340的输入,用于相应的延迟值。

因此,在图4和5中所示的装置的帮助下,可以根据以下等式,针对扬声器和麦克风功率谱,使用相干函数(例如平方相干函数)来计算或确定延迟值d:

Γd[k,m]=(E{|X[k-d,m]|2·|Y[k,m]|2})2E{|X[k-d,m]|2·|X[k-d,m]|2}·E{|Y[k,m]|2·|Y[k,m]|2},---(8)

其中,等式(8)中出现的期望值E{}也可以被实现为均值。在图4和5所示的实施例中,使用延迟值计算装置380的相干函数计算装置400来执行该计算。

基本地,可以针对每个频带和/或每个带通信号来计算延迟值d,其中带通信号是由整数索引m来确定的。然而,在图4和5所描述的实施例中,仅考虑使用单个延迟值用于所有频率和/或所有带通信号。出于这种原因,在回声预测增益计算装置410中,根据以下等式来计算所谓的回声预测增益ω[k]作为相干函数Γd[k,m]在各频率上的均值:

ωd[k]=1MΣm=0M-1Γd[k,m],---(9)

其中M是指示频带和/或带通信号的数目的整数。这里,各频带的索引m的范围从0至M-1。然后,通过优化装置420来选择实际延迟值d,使回声预测增益最大化。换言之,装置420根据以下等式来确定延迟值d:

d=argmaxdd[k]},(10)

其中函数argmaxd{}表示关于参数d来确定精确的最大值。

这里,如图4所示,经由延迟值计算装置380,将作为当前波形的函数的当前延迟值d发送给延迟装置340。更具体地,这里描述的延迟值计算装置380的连接是一种反馈电路,其中由于在相干函数的计算中已经考虑了延迟的信号,因此对延迟装置340可用的信号倾向于表示对延迟值d的校正信号。基本地,因此也可以使用Δd来表示根据等式(10)来计算的延迟值,Δd表示与先前计算的延迟值的偏差。可以通过延迟装置340来考虑Δd,以获得绝对延迟值d。然而,在基于非延迟的信号来进行计算的情况下,可以直接通过等式(10)来确定相应的延迟值。

关于回声估计滤波器,以下将示出参考文献[6]中使用的估计导致被系统性估计偏差所偏移后的估计。在参考文献[6]中,基于功率谱|Y[k,m]|2和|xd[k,m]|2,即基于直接测量和检测的麦克风和扬声器的频谱,直接执行回声估计滤波器的估计。在能量域中,针对回声估计滤波器获得了以下等式:

|G^biased[k,m]|2=E{|Y[k,m]|2·|Xd[k,m]|2}E{|Xd[k,m]|2·|Xd[k,m]|2}.---(11)

如附录A所示,由于静态噪声W[k,m]的加性部分,等式(11)的使用导致了回声估计滤波器的被系统性估计偏差所偏移的估计。因此,基于等式(11),在能量域中的回声估计滤波器产生为:

|G^biased[k,m]|2=|G[k,m]|2+σw2[k,m]E{|Xd[k,m]|2},---(12)

其中是在具有索引为m的频带和数据块索引或时间索引k中的静态噪声w[n]的方差。这里,从(12)立即得出:在有噪声的环境中,被系统性估计偏差所偏移的回声估计滤波器潜在地导致对回声信号的不可接受的高估计。由于回声信号的过高估计典型地导致过度强烈的回声抑制,因此在同时的双向通信(双重谈话情形)期间,近端话音信号中的干扰将高得不可接受。

在使用本发明的实施例时,如图4和5所示,例如,关于扬声器和麦克风功率谱的时间波动来估计回声估计滤波器G[k,m]。这里将功率谱的时间波动确定为“集中的”或平均的版本,即减小——更一般地——考虑相应均值。因此,在修正装置260中,第二修正装置260b根据以下等式来计算修正的功率谱作为麦克风信号的修正的与能量相关的值:

Y~|[k,m]|=|Y[k,m]|2-E{|Y[k,m]|2}.---(13)

相应地,修正装置260也以第一修正子装置260a的形式,根据以下等式来计算扬声器信号的修正的功率谱:

X~d[k,m]=|Xd[k,m]|2-E{|Xd[k,m]|2}.----(14)

这里,由均值确定装置250来形成等式(13)和(14)中的数学期望值E{}。这里,两个均值确定子装置250a和250b可以方便地基于相应的与功率相关的值来使用短时均值替代上述等式中所使用的数学期望值E{}。从以下示例开始:

ΦAB[k,m]=E{A[k,m]·B[k,m]},(15)

其中值A[k,m]和B[k,m]可以表示任意值,甚至是相等的值,例如,根据以下等式来执行递归平滑,以获得关于值ΦAB[k,m]的短时均值

Φ^AB[k,m]=(1-αavg)Φ^AB[k-1,m]+αavgA[k,m]·B[k,m].---(16)

这里,因子αavg确定了时间上的平滑程度,并可以适于任何给定的要求。

换言之,可以根据以下等式来对任意量A[k,m]来计算时间均值,其中k是时间索引:

E(A[k,m])=(1-αavg)E(A[k-1,m])+αavg·A[k,m],(17)

其中,基于当前值A[k,m]和先前计算的均值E(A[k-1,m])来递归地计算量E(A[k,m])。这里,因子αavg对新值A[k,m]相对于先前计算的均值的附加贡献进行加权,使用因子(1-αavg)来对先前计算的均值进行加权。

因此,在等式(15)至(17)给出的计算规则的帮助下,可以在均值确定装置250及其两个均值确定子装置250a和250b中,根据对这些装置可用的相应数据来确定相应的均值。这里,根据等式(15)至(17)的计算规则的实现方式表示了一种可以实时执行的递归的滑动平均。具体地,这里不用等待“未来”的数据块。

现在,具有估计装置350的控制信息计算装置270能够基于从修正装置260提供的修正的与能量相关的值来计算声学抑制滤波器210的控制信息。为此,估计装置350考虑功率谱的时间波动,首先根据以下等式来计算回声估计滤波器

|G^[k,m]|2=E{Y~[k,m]·X~d[k,m]}E{X~[k,m]·X~d[k,m]}.---(18)

更具体地,根据等式(18)来计算相应回声估计滤波器的幅度频率过程,其中,也可以通过各种方法来添加和/或估计相关联的相位信息。只要有必要,例如可以对所有频带、频率范围或带通信号使用恒定相位作为相位信息,该恒定相位根据相应频带的延迟值d来确定,或是根据相应幅度的时间过程或频谱过程来确定。

通过如等式(18)中所执行的估计,仅使用扬声器信号和麦克风信号的频谱动态来估计回声估计滤波器。如也在附录B中示意的,根据等式(18)的估计抵消了加性静态噪声信号w[n]。如在附录B中的偏差中所示,使用等式(18)带来了回声功率传递函数|G[k,m]|2的无偏移估计。更具体地,有:

|G^[k,m]|2=|G[k,m]|2.---(19)

此外,这里要指出,作为使用等式(8)的一种替代选择,也可以基于波动的频谱,使用根据以下等式的相干函数来执行对延迟值d的估计:

Γ~d[k,m]=(E{X~[k-d,m]·Y~[k,m]})2E{X~[k-d,m]·X~[k-d,m]}·E{Y~[k,m]·Y~[k,m]},---(20)

其中以与等式(14)类似的方式定义。然后,基于回声预测增益

ω~d[k]=1MΣm=0M-1Γ~d[k,m]---(21)

来选择实际延迟值,使得回声预测增益最大化。

换言之,延迟值计算装置380也可以使用除了结合等式(8)和(9)所表示的量之外的量来执行延迟值计算。对于图4,这意味着经由可选地绘出的路径将其他值提供给延迟值计算装置380,使得这些值在输入390处可用。控制信息计算装置270以基于设计参数β、γ和LH的滤波器系数H[k,m]的形式(以下将更详细介绍),使控制信息对声学抑制滤波器210可用。

在本发明的实施例中,可以在不同程度上对属于不同特征频率的扬声器信号的带通信号或由其导出的信号进行延迟。例如,当不同的传播路径具有频率选择性衰减时,这种延迟是可取的,使得直接传播路径不再提供特定频率范围中的最强信号成分。在这种情况下,可以基于相干函数和/或基于通过有限频带来进行的对回声预测增益的计算,直接执行延迟值的确定。

声学抑制滤波器210根据以下等式,通过使用合适的回声抑制滤波器来对麦克风信号进行加权,以执行声学回声抑制:

E[k,m]=H[k,m]·Y[k,m].(22)

这里,从第二时间/频率变换装置330-2的输出直接向声学抑制滤波器210提供麦克风频谱Y[k,m]。这里,加权因子和/或滤波器因子H[k,m]表示声学抑制滤波器210从用于控制信息的计算装置360获得的、和/或从控制信息计算装置270获得的控制信息。

这里,如参考文献[7]中所描述的,可以根据频谱减法方法来计算回声估计滤波器H[k,m]和/或控制信息。在这种情况下,控制信息由以下等式给出:

H[k,m]=(max(|Y[k,m]|γ-β|Y^[k,m]|γ,10γLH20)|Y[k,m]|γ)1γ.---(23)

设计参数β、γ和LH用于控制回声抑制滤波器的期望性能。这里,典型值是β=2,γ=2和LH=-60(与-60dB的最大衰减相对应)。这里,根据以下等式,使用回声估计滤波器来获得回声的功率谱的估计:

|Y^[k,m]|2=|G^[k,m]|2·|Xd[k,m]|2.---(24)

用于控制信息的计算装置360也可以执行根据等式(24)的计算。优选地,关于扬声器信号和麦克风信号的原始频谱来执行回声估计和回声抑制。

图6示出了基于本发明的实施例针对1000Hz频率的数字结果。使用被1/F噪声(粉红噪声)破坏的、信噪比(SNR)为6dB的话音信号来产生仿真。这里,仿真的第一半专门与活动的远端说话者所导致的回声相对应,而仿真的第二半与双向谈话的情形(双重谈话情形)相对应。

图6的部分a以黑线示出了其上叠加1000Hz频率的扬声器信号的短时功率谱430和短时平均频谱。换言之,图6a示出了扬声器信号的短时功率谱430和相应的短时平均频谱440。

这里,部分图示b以虚线示出了真实的回声估计滤波器,以点线的方式示出了具有系统性估计偏差的估计,并以实线绘出了没有系统性估计偏差的估计。换言之,图6b中的部分图示以虚线示出了真实的回声估计滤波器G[k,m],以点线示出了根据等式(11)计算的具有系统性估计偏差的估计并以实线示出了如在本发明的实施例中和说明书中提出并描述的那样计算的没有系统性估计偏差的估计

部分图示6c示出了回声预测增益的时间过程,其中所有的三个部分图示中的每一个都是基于0秒(0s)至15秒(15s)的时间范围。如之前所解释的,仅在从0s至约7.5s的时间范围中包括来自扬声器的话音,该话音经由回声和麦克风被再次拾取,而在第二半,即约7.5s和15s之间的时间区间中,话音被附加地耦合入麦克风。

因此,部分图示6c与回声预测增益相对应,回声预测增益将回声估计滤波器的可靠性度量表示为时间的函数。这些图示出了在不考虑集中的统计特性的情况下计算的回声估计滤波器的系统性估计偏差,而当回声预测增益足够大时,基于时间波动的回声估计滤波器与真实的回声估计滤波器G[k,m]相对应。具体地,这示意出,在考虑均值去除的情况下,与不考虑均值去除的情况相比,回声估计滤波器与期望的过程具有明显更好的匹配。具体地,在部分图示6b中的10至15s之间的时间范围中,在相应的回声估计滤波器过程方面存在显著的可识别的差异。

图7示出了具有声学抑制滤波器210的装置200的另一实施例的简化电路框图。图7所选择的图示附加地示出了基于时间索引n的麦克风信号y[n]和扬声器信号x[n]的两个时间过程。与图3所示的实施例相比,图7示出了根据本发明实施例的声学回声抑制算法的更完整的电路框图。由于与图3所示的实施例的相似性,在此使本实施例描述更加简短,关于其他细节,参考对图3的陈述。

将扬声器信号x[n]提供给采取短时傅立叶变换(STFT)形式的第一时间/频率变换装置330-1。类似地,将麦克风信号y[n]提供给第二时间/频率变换装置330-2,装置330-2也是相应的STFT单元。如这两个波形的时间波形x[n]和y[n]的比较所示,由于扬声器信号以时间间隔d领先麦克风信号,因此,第一时间/频率变换装置330-1产生扬声器信号的相应时间延迟的频谱X[k-d,m]。

也使用两个大括号450-1和450-2以及指示时间间隔d的箭头460来表示图7上部中的两个时间过程。然而,第二时间/频率变换装置330-2以未经过时间延迟的形式来提供相应的麦克风信号的频谱Y[k,m]。相对于图4而言,在图7所示的实施例中,这意味着延迟装置340也被集成到第一时间/频率变换装置330-1中。

两个时间/频率变换装置330-1继而耦合至单元300,如在图3所示的实施例中已经示出的,单元300包括两个估计装置310-1和310-2,在图7中,将这两个估计装置称为ETF。这里,缩写ETF代表时间波动的估计。因此,估计装置310包括图4中的值确定装置230和均值确定装置250的功能。

单元300的输出侧继而耦合至回声估计滤波器320,在图7中再次将其标记为EEF(回声估计滤波器)。这里,回声估计滤波器320包括修正装置260的功能和控制信息计算装置270中的估计装置350的功能。回声估计滤波器320将相应的估计移交给回声抑制处理单元325(ERP=回声去除处理),回声抑制处理单元325基于两个频谱X[k-d,m]和Y[k,m]以及估计的滤波器来执行实际的回声去除。因此,在其功能方面,回声抑制处理单元325与用于控制信息的计算装置360和实际的声学抑制滤波器210相对应。

回声抑制处理单元325的输出提供了位于频域中的回声抑制后的信号,然后由频率/时间变换单元370(在本情况下是逆短时傅立叶变换(ISTFT))对该信号进行处理,使得在其输出处输出回声减小后的相应时间信号e[n]。

图3和7所示的实施例与图4和5所示的实施例的比较清楚地示出,在其功能方面,确实可以以不同的方式来实现各个装置和模块。因此,可以使用相应的数学转换将各个步骤重新组合。因此,例如,可以以与上述在回声抑制处理单元325中所描述的不同的方式来概括等式(22)至(24)的实现。因此,例如,可以在一个计算过程中,或者也可以在若干以不同方式进行子划分的计算中,执行相应计算。

图8示出了根据本发明的另一实施例,该实施例采取用于计算声学抑制滤波器210的控制信息的装置200的形式,其中装置200中也包括声学抑制滤波器210。这里,图8所示的实施例强调:也可以以其他声学回声抑制方法来实现和实施本发明的实施例。在图9中描述了另一实施例,该实施例示出了关于声学回声抑制方法的嵌入的第二种不同方法。

这里,图8示出了根据本发明实施例的声学回声抑制方法的框图,其中,对输入信号频谱X[k,m]应用回声估计滤波器

装置200包括扬声器100和麦克风110。将扬声器信号x[n]提供给采取离散傅立叶变换解析滤波器组(DFT=离散傅立叶变换)形式的时间/频率变换装置330-1,时间/频率变换装置330-1将该信号变换至频域。时间/频率变换装置330-1在其输出处输出频谱X[k,m],该频谱一方面被提供给延迟装置340,另一方面被提供给值确定装置230的第一值确定子装置230a。这里,频谱X[k,m]可以是实数值的,或者也可以是复数值的。

相应地,将麦克风110的麦克风信号y[n]提供给第二时间/频率变换装置330-2,第二时间/频率变换装置330-2在其输出处输出相应的实数值或复数值频谱Y[k,m]。该频谱一方面被提供给值确定装置230的第二值确定子装置230b,另一方面被直接提供给声学抑制滤波器210作为输入信号。

这里,根据本发明的实施例,两个值确定子装置230a、230b被形成为产生相应频谱的幅度平方,并将其提供给执行滤波器的估计和延迟值的估计d(k,m)的单元470。因此,单元470部分承担了均值确定装置250、修正装置260和延迟值计算装置380的功能。因此,单元470的相应电路和元件中至少部分包括这些装置。出于这种原因,单元470耦合至延迟装置340的输入,以向延迟装置340提供当前延迟值d(k,m)(=d)。例如,可以根据等式(18)来实现滤波器的确定。

延迟装置340根据向其提供的频谱X[k,m]来产生延迟版本X[k-d(k,m)m]。然后,使该延迟的扬声器频谱对于耦合至延迟装置340的回声估计滤波器480可用。

此外,回声估计滤波器480也耦合至单元470,经由该单元来以相关联的滤波器系数的形式获得实际的回声估计滤波器。因此,回声估计滤波器480执行图8所示的实施例中的等式(24)的功能,并因此被认为是控制信息计算装置270的一部分。

可以根据频谱、时间或其组合来估计回声估计滤波器的相位位置。此外,当然,也存在以其他方式来确定相位位置的可能性,例如通过将固定相位位置与每个系数相关联。例如,0°的相位可以与系数中的每个单个系数相关联。

回声估计滤波器480对输入信号进行滤波,以便在其输出提供信号该信号经由另一值确定装置230’的另一值确定子装置230c对用于控制信息的计算装置360可用。类似地,第二时间/频率变换装置330-2输出的麦克风频谱Y[k,m]也被提供给值确定装置230’的第四值确定子装置230d,第四值确定子装置230d的输出继而也耦合至用于控制信息的计算装置360。继而,两个值确定子装置230c和230d被形成为计算其可用的频谱的幅度平方。这里,在功能上,可以认为该另一值确定装置230’是图8中未示出的控制信息计算装置270的一部分。

这里,用于控制信息的计算装置360再次被形成为计算回声抑制系数H[k,m],并使其经由相应的控制输入对声学抑制滤波器210可用。

如之前已经解释的,由于第二时间/频率变换装置330-2的输出也耦合至声学抑制滤波器210的输入,因此,它能够计算回声抑制后的频谱E[k,m],并使其对采取逆离散傅立叶变换滤波器组形式的下游频率/时间变换装置370可用。该频率/时间变换装置(也被称为合成滤波器组)在其输出处提供回声抑制后的时间信号e[n]。

因此,图8中所示的实施例允许基于扬声器频谱的回声估计。如图8所示,对扬声器频谱X[k,m]应用延迟和/或延迟值d[k,m]以及回声估计滤波器以获得回声频谱的估计然后,基于所估计的频谱的频谱功率或幅度和麦克风信号的功率谱或幅度谱Y[k,m]来计算回声抑制滤波器H[k,m]。

这里要指出,在关于关键频带来确定回声估计滤波器的情况下,如将在其他过程中进行解释的,可以执行相应的插值,以获得位于STFT域中的回声估计滤波器的版本。

图9示出了采取声学抑制滤波器210与装置200在一起的形式的本发明的另一实施例,声学抑制滤波器210也在装置200中实现。与图8所示的实施例相反,图9所示的实施例是基于声学回声抑制的方法,其中,对输入信号的功率谱|x[k,m]|2应用回声估计滤波器

此外,图9和8所示的实施例在其结构特征方面有所不同,但仅在非常小的程度上不同。更具体地,它们在值确定子装置230a和230c的布置方面有很大不同。为了简化说明,在图9中未示出值确定装置230、230’。

更具体地,现在,值确定子装置230a直接连接在第一时间/频率变换装置330-1的下游,使得不仅将扬声器信号的功率谱X[k,m]已经提供给单元470,而且还将其提供给延迟装置340。相应地,延迟装置340也产生该功率谱的延迟形式,回声估计滤波器480根据等式(24)产生相应的幅度频率过程,然后将其直接提供给用于控制信息的计算装置360而无需额外的值确定子装置230c。换言之,通过将值确定子装置230a移动至延迟装置340的上游,可以省略第三值确定子装置230c的实现。类似地,这里可以省去回声估计滤波器的相位或相位位置的目标定义或确定。

然而,此外,图8和9所示的本发明的两个实施例彼此没有明显区别。仅在一些功能特征和一些计算规则上可能存在由于各个装置的其他提供的信号和信息而导致的偏差。

因此,图9示出了基于扬声器功率谱或扬声器幅度谱的回声估计。这表示了一种可选方法,其中对扬声器信号的功率谱或幅度谱|x[k,m]|2应用延迟值d(k,m)和回声估计滤波器以获得回声信号的功率谱或幅度谱的估计

与结合图8所讨论的方法相比,回声抑制滤波器H[k,m]还是基于所估计的回声幅度的功率谱或幅度谱和麦克风信号的功率谱或幅度谱|Y[k,m]|2来计算的。

在图8和9所示的实施例中,在时间以及当前频率方面,延迟值d(k,m)可以变化。当然,可以将延迟装置340中使用的延迟值选择为针对各个带通信号和/或频率范围是相同的。

图10示出了本发明的另一实施例,该实施例在其结构方面与图2所示的实施例类似。然而,图10和2中所示的实施例的区别在于,图10中所示的实施例是用于多声道变型的装置200。从结构上说,图2和10所示的实施例仅有略微差别,这是再次参考图2的描述的原因。

然而,与图2所示的装置200的实施例相反,图10所示的实施例200包括多个输入240-1、240-2……,如先前定义的,该多个输入允许向装置200提供信号组中的多个相应输入信号。因此,多个输入中的输入240-1、240-2……耦合至组合装置490,组合装置490根据在输入240处输入的信号来产生单个组合信号,然后使该单个组合信号对装置200的其他组件可用。更具体地,再次使组合装置490的该组合信号对值确定装置230、均值确定装置250、修正装置260和控制信息计算装置270可用,如上所述,控制信息计算装置270继而提供相应的控制信息。

图10所示的实施例与图2所示实施例的另外的区别还在于,声学抑制滤波器210现在包括子滤波器210-1、210-2……,根据相应实施例的具体实现方式,也可以向这些子滤波器提供在装置200的输入240处提供的输入信号,或也可以向这些子滤波器提供经由可选的附加输入280-1、280-2……提供给装置200的其他信号。换言之,根据具体实现方式,可以向声学抑制滤波器210中的每个单个子滤波器210-1、210-2提供在输入240-1、240-2……处可用的信号或可选的其他信号。这样的信号可以经由相应的可选输入280-1、280-2……提供给滤波器210-1、210-2。

然而,并行地使控制信息计算装置270的控制信息对声学抑制滤波器210中的所有子滤波器210-1、210-2……可用。因此,所有子滤波器210都相应地耦合至控制信息计算装置270的输出。各个子滤波器210-1、210-2……在相应输出290-1、290-2……处提供回声减小后的输出信号,该信号耦合至所述相应输出。

尽管之前仅针对单声道的情况讨论了本发明的实施例,在单声道情况下,仅有一个扬声器信号和一个麦克风信号可用,但是现在考虑多声道的情况。如在以下仍要描述的,本发明的实施例不局限于单声道情况,而是也可以类似地适用于声学多声道回声抑制系统。

令Xl[k,m]表示第l个扬声器信号的STFT域表示,首先,由组合装置490根据以下等式来对各个扬声器信号的频谱进行组合,从而计算所有扬声器声道的联合功率谱:

|X[k,m]|2=Σl=0L-1|Xl[k,m]|2.---(25)

这里,L表示扬声器声道的数目,l是声道索引,其范围从0至L-l。然而,这是一个非负整数。

类似地,根据以下等式来计算麦克风声道的联合功率谱:

|Y[k,m]|2=Σp=0p-1|Yp[k,m]|2,---(26)

其中Yp[k,m]表示第p个麦克风的信号,P是自然数,表示麦克风的数目。索引p表示各个麦克风信号,其范围从0至P-1。因此,与先前描述的索引m类似,索引l和p中的每一个分别在0至L-1、P-1和M-1的值范围内。

例如,可以通过相应的组合装置,也可以使用其他计算或确定规则来实现等式(25)和(26)中包含的组合。例如,如果在等式(25)和(26)中分别存在除以参数L和P的除法,则这是算术平均。出于这种原因,在部分情况下,组合装置也可以被称为平均装置。

与等式(7)类似,针对回声的功率谱的期望模型由以下给出:

|Y[k,m]|2≈|G[k,m]|2·|xd[k,m]|2+|w[k,m]|2,(27)

其中,在多声道情况下,功率谱|x[k,m]|2和|Y[k,m]|2由等式(25)和(26)给出。当然,如上所述,这里也产生在时间上相应延迟的信号。

如上所述,为了确定回声估计滤波器|G[k,m]|2,使用相应方法,然而,在该相应的方法中,如以上所定义的来使用联合的扬声器功率谱和联合的麦克风功率谱。这对于延迟值d的估计也一样,针对每个扬声器声道的联合功率谱来计算延迟值d的估计。

然后,对每个麦克风信号,独立地执行实际的回声抑制,但是对每个麦克风声道使用相同的回声抑制滤波器。因此,适用:

Ep[k,m]=H[k,m]·Yp[k,m](28)

其中p=0,1,...,P-1。相应地,如结合图10所描述的,首先针对每个麦克风信号,在频域中确定相应的回声减小后的信号Ep[k,m],然后将该信号变换至时域。

当然,在图10所示的实施例中,可以使用在输入240处提供的和在输入280处提供的不同数目的信号。除非期望进行声道的并行计算和其他处理,其意义仅在于为要处理的每个信号实现相应的独立的声学抑制子滤波器210。

当然,也可以对本发明的实施例进行组合,使得仅将一个麦克风信号与多个扬声器信号组合,因此,仅对扬声器信号来实现附加组件。类似地,也可以利用一个扬声器信号对多个麦克风信号的实现方式。例如在车辆免提电话系统中可能遇到第一种情形,在该情形中经由车辆的HiFi系统输出另一端的话音,而在具有单个中心扬声器和每方一个麦克风的会议系统的情况下可能出现第二种场景。当然,这里,扬声器信号和麦克风信号的数目可以彼此相同或不同。

在结合图12和13来解释本发明的各个实施例的频率分辨率并讨论替代选择之前,首先结合图11来描述滤波器500的实施例,图11也示出了各个装置也能够在其电路和处理实现方面进行灵活适配。

这里,如图11所示,声学抑制滤波器500在很大程度上与图2所示的装置200中的声学抑制滤波器210相对应。因此,图11中的声学抑制滤波器500也包括输入240,与计算装置220非常类似的计算装置510具有输入240。经由输入240,向值确定装置230提供之前描述的信号组中的信号,值确定装置230是计算装置510的一部分。值确定装置230的输出一方面耦合至均值确定装置250,另一方面耦合至修正装置260。均值确定装置250的输出也耦合至修正装置260。在这方面,到目前为止,声学抑制滤波器500的结构描述和功能连接与装置200中的没有区别。

然而,现在将修正装置260的输出耦合至声学抑制滤波器装置520的输入,声学抑制滤波器装置520在其功能上与声学抑制滤波器210相对应。然而,与图2中的声学抑制滤波器210不同,声学抑制滤波器单元520也直接耦合至输入240或可选的其他输入280,以基于从修正装置260接收的修正后的与能量相关的值来对相应信号之一进行滤波。相应地,声学抑制滤波器装置520耦合至输出290,在输出290处可以输出回声减小的信号。

因此,图11所示的声学抑制滤波器500的实施例与图2所示的装置200的实施例的区别例如在于,在实际的声学抑制滤波器和/或声学抑制滤波器装置520中包括了装置200的部分功能。换言之,这意味着声学抑制滤波器装置520包括图2所示的控制信息计算装置270的功能。如之前已经解释的,相对于先前描述的模块,这里可能出现功能和/或结构的软化(softening)。

在频率分辨率方面,与频谱分辨率偏离一个STFT单位也是可取的。STFT的均匀频谱分辨率通常不能很好地适应于人类感知。因此,如在参考文献[8]中所述,将均匀间隔的频谱系数|x[k,m]|2和|Y[k,m]|2分组为多个非交叠的分区或组是有利的,其中,带宽模仿了人类听觉系统的频率分辨率。就此而言,也引用参考文献[9]。

如参考文献[9]中所述,对于16kHz的采样率,长度为512的DFT滤波器组的使用和15个分区的使用可以表示一种合适的选择,其中每个分区具有约两倍于等效矩形带宽(ERB)的带宽。如图12中所示,频带与分区相对应。

因此,图12示出了如何将均匀STFT频谱的频谱系数分组为模仿人类听觉系统的非均匀频率分辨率的分区。因此,图12示出通过操作于16kHz的采样装置可取得的总计15至16个频带的布置,作为0Hz至8000Hz之间的频率的函数。图12清楚地示出了相应的频率分区随着频率的增大如何变得更宽。

仅对每个分区的中心频率来计算不同的增益滤波器。与均匀STFT频谱的全频谱分辨率的情况相比,这还带来了较低的计算复杂度。在对STFT频谱的均匀信号应用最后的分区增益滤波器之前,使用Hann插值滤波器对相应频谱进行插值。

因此,图13a示出了可以用于对增益滤波器进行平滑的潜在的Hann插值滤波器,作为频率的函数。图13b以实线600的形式示出了相应的增益滤波器系数,可以通过在分区中对图13b中黑点所表示的增益滤波器的值进行插值来获取这些系数。这里,在图13b的横坐标上所示的频率轴也与图13a中所示的图示相关。

换言之,部分图示13a示出了Hann滤波器,部分图示13b示出了在应用相应的插值之前和之后增益滤波器值的示例。这里,使用点来表示之前的值,使用线600来表示插值。增益滤波器的频率平均导致所产生的频谱的变化的平均作为频率的函数,从而减小了音调、音乐噪声和其他伪像。

根据具体实现方式,这里,本发明的实施例可以包括:接收至少一个扬声器信号;接收至少一个麦克风信号;将扬声器和麦克风信号转换为短时频谱;计算相应的扬声器和麦克风信号的功率谱;对扬声器和麦克风功率谱进行滤波以获得相应的时间波动频谱;根据扬声器时间波动频谱来计算用于估计麦克风时间波动频谱的回声估计滤波器;使用回声抑制滤波器来去除麦克风信号频谱中的回声;以及将具有抑制后的回声的麦克风信号频谱转换回时域以获得回声去除后的输出信号。

至此,指出以下内容仍然是有意义的:可以通过相应的解析滤波器组,利用傅立叶变换、向子带域的变换或向QMF域的变换,来处理本发明实施例中的带通信号。可以通过相应的合成滤波器组来完成相应的反变换。

类似地,指出以下内容是有意义的:可以使用完全或部分相同的线路、电路和对象来形成不同的装置。类似地,指出以下内容是有意义的:麦克风信号和扬声器信号一般是不同的信号。至此,要再次指出的是,在上述实施例中获得的中间结果不必以上述方式来产生。更合理地,也可以使用数学转换来实现本发明的实施例,在所述数学转换中,能够直接取得其他中间结果或不取得任何中间结果。类似地,在多声道实现的情况下,可以基于导出的信号来计算与能量相关的值,但是进一步的计算基于各个信号来进行。

也要指出,上述采用装置和系统形式的结构实施例也可以被理解为表示各个计算步骤、方法步骤和其他步骤的流程图。在这方面,在此无需分别描述方法和装置。

在本说明书中,实质上,先前已经考虑了以电数字方式编码的音频信号,其中,在回声抵消系统中计算延迟值,并将其应用到扬声器信号和/或由其导出的信号。然而,如在开始处所解释的,在其他信号处理电路中确实也需要针对其他信号来确定相应的延迟值,并可能将信号延迟该延迟值。

这里,作为可能的应用领域,要提到补偿电路和补偿装置,其中要将不同的信号关于其运行时间、相位位置或其他参数互相适配。除了上述电数字编码的音频信号之外,其他电数字编码的信号也可能需要相应延迟。对模拟电信号、光学模拟信号和光数字编码的信号也是如此。根据具体实现方式,这里可以将相应信息编码在电压值、电流值、频率值、相位值、强度值或其他电或光信号的量中。除了上述音频信号之外,例如视频信号、一般数据信号,还有同步信号和其他信号也可能需要相应延迟。

不论各种实现方式的多样性,在其他过程中将描述的本发明的实施例采取用于主要基于数字编码的电信号来确定延迟值的装置形式,其中,随后将对用于上述应用领域的实施例的相应变化进行解释和描述。

图14示出了用于计算延迟装置710的延迟值d的装置700。这里,延迟装置710本身是装置700的可选组件,因此在图14中以虚线绘出。

这里,装置700包括针对第一和第二信号的第一输入720-1和第二输入720-2。如之前所解释的,这些信号可以是电数字编码的音频信号,也可以是相应的其他信号。这里,延迟装置710的输入侧耦合至针对第一信号的第一输入720-1。延迟装置710的输出侧耦合到装置700的输出730,在输出730上以延迟形式输出第一信号。此外,延迟装置710包括输入710a,在输入710a上提供的信号包括与第一信号在输入720-1与输出730要延迟的延迟值相关的信息。相应地,延迟装置710被形成为将输入的第一信号相应地延迟该延迟值。

装置700还包括耦合至两个输入720的可选的时间/频率变换装置740。时间/频率变换装置740的第一和第二输出耦合至值确定装置750,值确定装置750继而经由针对基于第一信号的信号输出和针对基于第二信号的信号输出耦合至均值确定装置760和修正装置770中的每一个。修正装置770还包括两个另外的输入,使用这两个另外的输入,修正装置770耦合至均值确定装置760和均值确定装置760的两个输出,这两个输出用于与第一信号和第二信号相关的信号。

在图14所示的装置700的实施例中,修正装置770也包括耦合至延迟值计算装置780的两个相应的输出。延迟值计算装置780继而包括耦合至延迟装置710的控制输入710a的输出。

如结合上述用于计算控制信息的装置200和声学抑制滤波器500的实施例所描述的,所述装置可以是计算装置790的一部分,例如,可以采用处理器的形式来实现计算装置790。可选地,各个组件(例如延迟装置710)也可以不是该计算装置790的一部分。

在其功能上,各个装置与之前描述的装置相对应。因此,例如,时间/频率变换装置740被形成为将第一和第二信号中的每个信号的一个数据块转换为相应的频谱表示,然后在其他装置中对其进行其他处理。更具体地,这里,时间/频率变换装置740针对两个信号中的每个信号输出一个或更多带通信号,每个带通信号具有相关联的一个或更多特征频率。这里,带通信号与和频率相关的域相关联,与频率相关的域还可以是(仅列出三个示例):实际的频域、子带域或QMF域。

在其功能上,值确定装置750与值确定装置230相对应,因此这里在这方面可以参考先前的实施例。然而,与采取其最一般且简单的形式的值确定装置230不同,图14中所示的实施例的装置700的值确定装置750被形成为对两个信号计算与带通信号相关联的至少一个与能量相关的值。在本发明的其他实施例中,它还被形成为对所有带通信号计算多个或相应的与能量相关的值,即例如相应带通信号的能量值或幅度值。这里,各种带通信号继而与不同的特征频率相关联,其中典型地,针对这种情况下的两个信号,考虑与相同特征频率相对应的带通信号。

在其功能上,均值确定装置760与先前描述的实施例中的均值确定装置250相对应,其中,均值确定装置760仍对两个信号确定相应的均值。出于这种原因,此处可以再次参考关于均值确定装置250的描述。

对于修正装置770,也适用同样的原理,其与先前的实施例中的修正装置260相对应,其中,它也对两个信号执行相应的修正。

最终,在延迟值的计算值d[k,m]方面,延迟值计算装置780与延迟值计算装置380和单元470相对应。出于这种原因,在描述中也参考与这些装置和单元相关的对应的说明书段落。

换言之,在本发明的实施例中,例如,延迟值计算装置780可以被形成为执行等式(8)至(10)中描述的功能。相应地,在本发明的实施例中,修正装置770可以相应地被形成为实现等式(13)和(14)中描述的功能。因此,均值计算装置760也可以基本上被理解为实现等式(15)至(17)所限定的功能。最后,值确定装置750可以被理解为用于对相应信号的输入值计算结合图2已经针对其进行过解释的与能量相关的值的装置。

在其功能上,延迟装置710不仅与延迟装置340相对应,也与同样实现相应功能的其他组件相对应,如图7中的时间/频率变换单元330-1。类似地,计算装置790和220可以互相对应。相对于上述输入240、280和输出290,输入720和输出730也互相对应。

如这里的讨论所示,图1至13中所示的许多装置和声学抑制滤波器也是采取装置700形式的本发明的实施例,即使其中为了简单的原因而未对其进行如此表示。

如上所述,例如,图14中所示的采取装置700形式的本发明的实施例可以带来更快也可能是改进的第一信号相对于第二信号的延迟值的适配。例如,在运行时间补偿问题中这是非常有利的,在该问题中,相应的差别在时间上不是恒定的。这尤其是通过以下方式来实现的:可以通过相应平均来确定与频率相关的域中的噪声部分和其他静态噪声成分,所述噪声部分和其他静态噪声成分是在与能量相关的值方面以系统性估计偏差形式的恒定值出现的。然后,在修正装置770中还可以考虑这些值。

如也在图14中所示,例如,所确定的延迟值可以用于延迟相应的信号。除了多次提及的运行时间补偿之外,也可以在回声去除系统和其他同步电路中采用相应的延迟电路。

此外,在本发明的实施例中,也可以将装置700实现为一种多声道变型。在这种情况下,装置700的这种多声道变型包括针对第一信号的多个输入720-1、针对第二信号的多个输入720-2,或两者都包括,其中,在后一种情况下,针对第一和第二信号的输入的数目可以彼此相同或也可以彼此独立。

在这样的装置700中,根据相应的第一和第二信号的类型,可以在时间/频率变换装置740中针对每一个信号来实现可选的时间/频率变换子装置,以执行向频域的变换。如结合之前的组合装置490已经描述过的,可以将用于组合输入的第一信号和输入的第二信号的组合装置连接在时间/频率变换装置740与值确定装置750和/或伴随的输入720与值确定装置750之间。然后,可以如上所述地进行其他的信号处理。

装置700的这种多声道变型还包括多个延迟装置710,其数目典型地与针对第一信号的输入720-1的数目相对应。所述多个延迟装置710的控制输入(经由控制输入来获得延迟值)并行地耦合至延迟值计算装置780,使得这些延迟装置中的每一个获得相同的延迟值。

当然,如上所述,针对多个带通信号或对所有带通信号,这里也可以单独地对具有其特征频率的每个带通信号进行延迟值的计算。当然,如图14所示,在装置700的情况下,即在不具有多声道能力的实现方式中,也可以实现这一点。

根据条件,可以以硬件或软件形式来实现本发明的实施例。实现方式可以是在数字存储介质上,例如软盘、CD、DVD或其他具有电可读的控制信号的计算机可读存储介质,该数字存储介质可以与可编程计算机系统协作来执行本发明的方法。一般地,因此,本发明的实施例也在于具有程序代码的软件程序产品和/或计算机程序产品和/或程序产品,所述程序代码存储在机器可读载体上,当软件程序产品在计算机或处理器上执行时,所述程序代码执行方法实施例。换言之,因此,本发明的实施例可以被实现为具有程序代码的计算机程序和/或软件程序和/或程序,当程序在处理器上执行时,所述程序代码执行方法实施例。这里,处理器可以由计算机、芯片卡(智能卡)、专用集成电路(ASIC)、片上系统(SOC)或其他集成电路(IC)形成。

参考文献

[1]C.Breining,P.Dreiseitel,E.A.Mader,B.Nitsch,H.Puder,T.Schertler,G.Schmidt,and J.Tilp.Acoustic echo control.IEEESignal Processing Magazine,16(4):42-69,July 1999.

[2]A.N.Birkett and R.A.Goubran.Limitations of handsfree acousticecho cancelers due to nonlinear loudspeaker distortion andenclosure vibration effects.In Proc.IEEE Workshop onApplications of Signal Processing to Audio and Acoustics,pages 13-16,New Paltz,Oct.1995.

[3]G.Schmidt and E.Acoustic echo and noise control:apractical approach.Hoboken:Wiley,2004.

[4]W.L.B.Jeannes,P.Scalart,G.Faucon,and C.Beaugeant.Combined noise and echo reduction in hands-free systems:a survey.IEEE Transactions on Speech and Audio Processing,9(8):808-820,Nov.2001.

[5]C.Faller and J.Chen.Suppressing acoustic echo in a sampledauditory envelope space.IEEE Trans.on Speech and Audio Proc.,13(5):1048-1062,Sept.2005.

[6]C.Faller and C.Tournery.Estimating the delay and colorationeffect of the acoustic echo path for low complexity echosuppression.In Proc.Intl.Works.on Acoust.Echo and NoiseControl(IWAENC),Sept.2005.

[7]W.Etter and G.S.Moschytz.Noise reduction by noise-adaptivespectral magnitude expansion.J.Audio Eng.Soc.,42:341-349,May 1994.

[8]C.Faller and F.Baumgarte.Binaural Cue Coding-Part II:Schemesand applications.IEEE Trans.on Speech and Audio Proc.,11(6):520-531,Nov.2003.

[9]B.R.Glasberg and B.C.J.Moore.Derivation of auditory filtershapes from notched-noise data.Hear.Res.,47:103-138,1990.

附录A

具有系统性估计偏差的回声估计滤波器

以下将示出,参考文献[6]中提出的等式(11)对回声估计滤波器|G[k,m]|2的零点偏移估计。将要示出,该零点偏移是由于麦克风信号中的静态噪声w[n]的效应而导致的。

首先,

E{|Y[k,m]|2|Xd[k,m]|2}=E{|G[k,m]|2|Xd[k,m]|2+|W[k,m]|2|Xd[k,m]|2}

=|G[k,m]|2E{|Xd[k,m]|4}+σw2[k,m]E{|Xd[k,m]|2}

其中是具有索引m的频带内的静态噪声w[n]的方差。此外,

E{|xd [k,m]|2|xd[k,m]|2}=E{|xd[k,m]|4}。

因此,根据等式(11)的回声估计滤波器产生:

|G^biased[k,m]|2=E{|Y[k,m]|2|Xd[k,m]|2}E{|Xd[k,m]|2|Xd[k,m]|2}.---(29)

=|G[k,m]|2+σw2[k,m]E{|Xd[k,m]|2}

可以看到,静态噪声信号w[n]将零点项引入回声估计滤波器的估计中。此外,等式(29)暗示,回声估计滤波器中的零点偏移将随着噪声方差的增大而变得更大。

附录B

没有系统性估计偏差的回声估计滤波器

在本说明书提出的方法中,为了去除被引入回声估计滤波器的估计的零点偏移,在集中的中心统计特性|Y[k,m]|2和|Xd[k,m]|2的帮助下来计算该估计。与附录A中的过程类似,这里提出的方法产生了以下表达式:

E{Y~[k,m]X~d[k,m]}

=E{(|Y[k,m]|2-E{|Y[k,m]|2})(|Xd[k,m]|2-E{|Xd[k,m]|2})}

=E{(|G[k,m]|2|Xd[k,m]|2+|W[k,m]|2-E{|Y[k,m]|2})·(|Xd[k,m]|2-E{|Xd[k,m]|2})}

=E{(|G[k,m]|2|Xd[k,m]|4-|G[k,m]|2|Xd[k,m]|2E{|Xd[k,m]|2}+|W[k,m]|2|Xd[k,m]|2+

-|W[k,m]|2E{|Xd[k,m]|2}-E{|Y[k,m]|2}E{|Xd[k,m]|2})}

=E{(|G[k,m]|2|Xd[k,m]|4-|G[k,m]|2|Xd[k,m]|2E{|Xd[k,m]|2})}

=|G[k,m]|2(E{|Xd[k,m]|4}-(E{|Xd[k,m]|2})2)

此外,

E[X~d[k,m]X~d[k,m]}=E{(|Xd[k,m]|2-E{|Xd[k,m]|2})2}

=E{|Xd[k,m]|4}-(E{|Xd[k,m]|2})2.

因此,根据等式(18)的回声估计滤波器产生:

|G^[k,m]|2=E{Y~[k,m]X~d[k,m]|}E{X~d[k,m]X~d[k,m]|

=|G[k,m]|2

因此,可以看到,在麦克风信号中包含近端的静态背景噪声的情况下,等式(18)带来了回声功率传递函数的正确估计。

参考标记列表

100扬声器

110麦克风

120声学环境

130扬声器信号

140麦克风信号

150直接传输路径

160间接传输路径

170回声去除处理单元

200装置

210声学抑制滤波器

220计算装置

230值确定装置

240输入

250均值确定装置

260修正装置

270控制信息计算装置

280另外的输入

290输出

300单元

310估计装置

320回声估计滤波器

325回声抑制处理电路

330时间/频率变换装置

340延迟装置

350估计装置

360用于控制信息的计算装置

370频率/时间变换装置

380延迟值计算装置

390输入

400相干函数计算装置

410回声预测增益计算装置

420优化装置

430短时功率谱

440平均的短时功率谱

450大括号

460箭头

470单元

480回声估计滤波器

490组合装置

500声学抑制滤波器

510计算装置

520声学抑制滤波器

600线

700装置

710延迟装置

720输入

730输出

740时间/频率变换装置

750值确定装置

760均值确定装置

770修正装置

780延迟值计算装置

790计算装置

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号