首页> 中国专利> 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球面麦克风阵列的信号的方法及装置

处理用于产生声场的高保真度立体声响复制表示的刚性球上的球面麦克风阵列的信号的方法及装置

摘要

球面麦克风阵列捕捉三维声场{P(Ωc,t))以产生高保真度立体声响复制表示{Amn(t)),其中,通过阵列的炭精盒对在球的表面上的压力分布进行采样。使用逆麦克风传递函数移除麦克风对所捕捉的声场的影响。麦克风阵列的传递函数的等化是大问题,因为传递函数的倒数对在传递函数中的较小的值造成高增益并且这些较小的值受到换能器噪声影响。本发明通过在频域中使用维纳滤波器处理(34)使该噪声最小化,其中,根据麦克风阵列的信噪比针对每个波数自动地控制(33)该处理。

著录项

  • 公开/公告号CN103931211A

    专利类型发明专利

  • 公开/公告日2014-07-16

    原文格式PDF

  • 申请/专利权人 汤姆逊许可公司;

    申请/专利号CN201280055175.1

  • 发明设计人 S.科登;J-M.巴特克;A.克鲁格;

    申请日2012-10-31

  • 分类号H04R3/00(20060101);H04R5/027(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人吕晓章

  • 地址 法国伊西莱穆利诺

  • 入库时间 2023-12-17 00:50:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-15

    授权

    授权

  • 2016-08-03

    专利申请权的转移 IPC(主分类):H04R3/00 登记生效日:20160714 变更前: 变更后: 申请日:20121031

    专利申请权、专利权的转移

  • 2014-10-29

    实质审查的生效 IPC(主分类):H04R3/00 申请日:20121031

    实质审查的生效

  • 2014-07-16

    公开

    公开

说明书

技术领域

本发明涉及处理用于产生声场的高保真度立体声响复制(Ambisonics) 表示的刚性球上的球面麦克风阵列的信号的方法及装置,其中,对逆麦克风 阵列响应施加校正滤波器。

背景技术

球面麦克风阵列提供了捕捉三维声场的能力。一种存储并处理声场的方 式是Ambisonics表示。Ambisonics使用正交球面函数描述在原点(也被称 为“最佳听音位置(sweet spot)”)周围的区域中的声场。描述的准确度取决 于Ambisonics阶N,其中,有限数量的Ambisonics系数描述声场。球面阵 列的最高Ambisonics阶受限于麦克风炭精盒的数量,其中,该数量必须等于 或大于Ambisonics系数的数量0=(N+1)2

Ambisonics表示的一个有利之处在于,声场的再现可以单独地适用于任 何指定的扬声器布置。而且,该表示使得能够在后期制作时使用音束成形技 术对不同的麦克风特征进行仿真。

B格式是Ambisonics的一个已知示例。B格式麦克风需要在四面体上有 四个炭精盒以捕捉Ambisonics阶为1的声场。

阶大于1的Ambisonics被称为高阶Ambisonics(HOA),典型地,HOA 麦克风是在刚性球上的球面麦克风阵列,例如mhAcoustics的Eigenmike。 为了进行Ambisonics处理,阵列的炭精盒对在球的表面上的压力分布进行采 样。然后,将采样压力转换为Ambisonics表示。这种Ambisonics表示描述 了声场,但是包含了麦克风阵列的影响。使用将平面波的声场变换为在麦克 风炭精盒测量的压力的逆麦克风阵列响应移除麦克风对所捕捉的声场的影 响。对炭精盒的方向性和麦克风阵列对声场的干扰进行仿真。

麦克风阵列的传递函数的等化对于HOA记录是大问题。如果阵列响应 的Ambisonics表示是已知的,则可以通过Ambisonics表示与逆阵列响应的 相乘来移除影响。然而,使用传递函数的倒数可能在传递函数中对较小的值 和零造成高增益。因此,应当考虑健壮的逆传递函数来设计麦克风阵列。例 如,B格式麦克风使用心形(cardioid)炭精盒来克服在全向炭精盒的传递函 数中的零。

发明内容

本发明涉及在刚性球上的球面麦克风阵列。刚性球的遮挡效应使具有相 对于阵列直径的较小的波长的频率能够具有良好的方向性。另一方面,这些 麦克风阵列的滤波器响应对于低频和高Ambisonics阶(亦即大于1)具有非 常小的值。因此,捕捉的压力的Ambisonics表示具有较小的更高阶系数,其 表示与阵列大小相比较长的波长的在炭精盒上的小压差。压差受换能器噪声 影响,并且因此更高阶系数也受换能器噪声影响。因此,对于低频,逆滤波 器响应主要是放大噪声而不是放大更高阶Ambisonics系数。

用于克服该问题的已知技术是使低频的高阶逐渐消失(或者高通滤波 器)(亦即,在该处限制滤波器增益),其一方面减少了低频的空间分辨率, 但另一方面移除了(高度失真的)HOA系数,从而破坏了完整的Ambisonics 表示。在Sébastien Moreau、Daniel、Stéphanie Bertet的《3D Sound field  Recording with Higher Order Ambisonics–Objective Measurements and  Validation of4th Order Spherical Microphone》(Audio Engineering Society会 议论文,2006年5月20日至23日第120届会议,法国巴黎)的第4节中描 述了一种尝试使用Tikhonov正则化滤波器解决该问题的对应的补偿滤波器 设计。Tikhonov正则化滤波器使由Ambisonics阶的限制导致的均方误差最 小化。然而,Tikhonov滤波器需要必须通过“试错”手动地调整以适应所记 录的信号的特征的正则化参数,并且没有定义该参数的解析式。根据Boaz  Rafaely的《Analysis and Design of Spherical Microphone Arrays》(IEEE  Transactions on Speech and Audio Processing,第13卷,第1号,第135至143 页,2005年)的关于球面麦克风阵列的分析,本发明示出如何根据麦克风信 号的信号统计自动地得到正则化参数。

本发明要解决的问题是使在布置在刚性球上的球面麦克风阵列的信号 的Ambisonics表示中的噪声(特别是低频噪声)最小化。该问题通过在权利 要求1中公开的方法得以解决。在权利要求2中公开了一种利用该方法的装 置。

本发明的处理用于依赖平均声场功率与麦克风炭精盒的噪声功率的信 噪比计算正则化Tikhonov参数,亦即,根据记录的麦克风阵列信号的信噪 比计算该最优化参数。对最优化或正则化的参数的计算包含以下步骤:

-将表示在所述麦克风阵列的表面上的压力的麦克风炭精盒信号P(Ωc,t) 转换为球面谐波(或者相等的Ambisonics)表示

-针对每个波数k,计算麦克风炭精盒信号P(Ωc,t)的时变信噪比SNR(k) 的估计,其中使用从麦克风阵列记录的平面波的平均源功率|P0(k)|2以 及表示由在麦克风阵列中的模拟处理产生的空间不相关的噪声的对应 的噪声功率|Pnoise(k)|2,亦即,包含通过分别计算参考信号和噪声信号 来计算平均空间功率,其中,参考信号是能够通过所使用的麦克风阵 列创建的声场的表示,并且噪声信号是由麦克风阵列的模拟处理产生 的空间不相关的噪声;

-通过使用对每个阶n对离散的有限的波数k根据信噪比估计SNR(k)设 计的时变维纳(Wiener)滤波器,将维纳滤波器的传递函数乘以麦克 风阵列的逆传递函数以便得到适应传递函数Fn,array(k);

-使用线性滤波器处理将对球面谐波表示施加该适应传递函数 Fn,array(k),得到适应方向系数

滤波器设计需要对声场的平均功率的估计以便得到记录的SNR。根据在 球面谐波表示中的对在阵列的炭精盒上的平均信号功率的仿真推出该估计。 该估计包含在球面谐波表示中的对炭精盒信号的空间一致性的计算。已知根 据平面波的连续的表示计算空间一致性,但是根据本发明对在刚性球上的球 面阵列计算空间一致性,因为不能以连续的表示计算在刚性球上的平面波的 声场。亦即,根据本发明,根据炭精盒信号估计SNR。

本发明包含以下优点:

-Ambisonics表示的阶最优地适合于每个频率子带的记录的SNR。这降 低了在Ambbisonics表示的再现时的可听噪声。

-滤波器设计需要对SNR的估计。其可以通过使用查找表以较低的计 算复杂度实现。这有助于以可管理的计算工作量进行时变自适应滤波 器设计。

-通过降噪,为低频部分地恢复方向信息。

基本上,本发明的方法适于处理在刚性球上的球面麦克风阵列的麦克风 炭精盒信号,所述方法包含以下步骤:

-将表示在所述麦克风阵列的表面上的压力的所述麦克风炭精盒信号 P(Ωc,t)转换为球面谐波或者Ambisonics表示

-针对每个波数k,使用从所述麦克风阵列记录的平面波的平均源功率 |P0(k)|2以及表示由在所述麦克风阵列中的模拟处理产生的空间不相关的噪 声的对应的噪声功率|Pnoise(k)|2,计算所述麦克风炭精盒信号P(Ωc,t)的时变信 噪比SNR(k)的估计;

-通过使用对每个阶n对离散的有限的波数k根据所述信噪比估计 SNR(k)设计的时变维纳滤波器,将所述维纳滤波器的传递函数乘以所述麦克 风阵列的逆传递函数以便得到适应传递函数Fn,array(k);

-使用线性滤波器处理对所述球面谐波表示施加所述适应传递函 数Fn,array(k),得到适应方向系数

基本上,本发明的装置适于处理在刚性球上的球面麦克风阵列的麦克风 炭精盒信号,所述装置包含:

-适用于将表示在所述麦克风阵列的表面上的压力的所述麦克风炭精 盒信号P(Ωc,t)转换为球面谐波或者Ambisonics表示的部件;

-适用于针对每个波数k,使用从所述麦克风阵列记录的平面波的平均 源功率|P0(k)|2以及表示由在所述麦克风阵列中的模拟处理产生的空间不相 关的噪声的对应的噪声功率|Pnoise(k)|2,计算所述麦克风炭精盒信号P(Ωc,t)的 时变信噪比SNR(k)的估计的部件;

-适用于通过使用对每个阶n对离散的有限的波数k根据所述信噪比估 计SNR(k)设计的时变维纳滤波器,将所述维纳滤波器的传递函数乘以所述麦 克风阵列的逆传递函数以便得到适应传递函数Fn,array(k)的部件;

-适用于使用线性滤波器处理对所述球面谐波表示施加所述适应 传递函数Fn,array(k),从而得到适应方向系数的部件。

在各个从属权利要求中公开了本发明的有利的另外的实施例。

附图说明

参考附图说明本发明的示例性的实施例,其中:

图1示出在刚性球上具有32个炭精盒的麦克风阵列的得到的扬声器权 数中的参考、混叠及噪声分量的功率;

图2示出对于SNR(k)=20dB的降噪滤波器;

图3示出基于框的自适应Ambisonics处理的框图;

图4示出在图2的最优化滤波器之后的权数分量的平均功率。

具体实施方式

在以下部分中说明球面麦克风阵列处理。

Ambisonics理论

通过假设辐射平面波的声场的扬声器定义Ambisonics解码,参见M.A  Poletti的《Three-Dimensional Surround Sound Systems Based on Spherical  Harmonics》(Journal Audio Engineering Society,第53卷,第11号,第1004 至1025页,2005年):

w(Ωl,k)=Σn=0NΣm=-nnDnm(Ωl)dnm(k)---(1)

L个扬声器的布置重构了存储在Ambisonics系数中的三维声场。 分别对每个波数

k=2πfcsound---(2)

执行该处理,其中,f是频率,csound是声音的速度。索引n从0到有限阶N, 而对于每个索引n,索引m从-n到n。因此,系数的总数为0=(N+1)2。 在球面坐标中通过方向向量Ωl=[Θl,φl]T定义扬声器位置,并且[·]T表示向量 的转置形式。

等式(1)定义了Ambisonics系数到扬声器权数w(Ωl,k)的转换。 这些权数是扬声器的驱动函数。所有扬声器权数的叠加重构了声场。

解码系数描述一般的Ambisonics解码处理。这包含在Morag  Agmon、Boaz Rafaely的《Beamforming for a Spherical-Aperture Microphone》 (IEEEI,第227至230页,2008年)的第3节中示出的音束方向图的共轭 复系数以及在上述的M.A Poletti的论文的第3.2节中给出的模式匹 配解码矩阵的行。在Johann-Markus Batke、Florian Keiler的《Using  VBAP-Derived Panning Functions for3D Ambisonics Decoding》(Proc.Of the 2nd International Symposimum on Ambisonics and Spherical Acoustics,2010年 5月6日至7日,法国巴黎)的第4节中描述的不同的处理方式使用基于向 量的幅度平移计算用于任意三维扬声器布置的解码矩阵。还通过系数描述这些矩阵的行元素。

如在Boaz Rafaely的《Plane-wave decomposition of the sound field on a  sphere by spherical convolution》(J.Acoustical Society of America,第116卷, 第4号,第2149至2157页,2004年)的第3节中所述,可以总是将Ambisonics 系数分解为平面波的叠加。因此,该分析可能限制为从方向Ωs入射 的平面波的系数:

dnplanem(k)=P0(k)Ynm(Ωs)*---(3)

定义平面波的系数,以采用辐射平面波的声场的扬声器。通过波数 k的P0(k)定义在原点处的压力。共轭复球面谐波表示平面波的方向 系数。使用在上述的M.A.Poletti的论文中给出的球面谐波的定义。

该球面谐波是Ambisonics表示的正交基函数,并且满足

δn-nδm-m=ΩS2Ynm(Ω)Ynm(Ω)*,---(4)

其中,

是三角形脉冲。

球面麦克风阵列对在球的表面上的压力进行采样,其中,采样点的数量 必须等于或者大于N阶Ambisonics的Ambisonics系数的数量0=(N+1)2。 而且,采样点必须均匀分布在球的表面上,其中,仅确切知道关于阶N=1 的0个点的最优分布。对于更高阶,存在球的采样的优良的近似值,参见: mh acoustics主页http://www.mhacoustics.com(访问日:2007年2月1日) 以及F.Zotter的《Sampling Strategies for Acoustic Holography/Holophony on  the Sphere》(Proceedings of the NAG-DAGA,2009年3月23日至26日,鹿 特丹)。

对于最优的采样点Ωc,根据等式(4)的积分等于根据等式(6)的离 散和:

δn-nδm-m=4πCΣc=1CYnm(Ωc)Ynm(Ωc)*,---(6)

其中,对于C≥(N+1)2,n′≤N并且n≤N,C是炭精盒的总数。

为了获得非最优采样点的稳定结果,可以用从L×0的球面谐波矩阵Y得 到的伪逆矩阵的列替换共轭复球面谐波,其中,球面谐波的0个 系数是Y的行元素,参见上述的Moreau/Daniel/Bertet的论文中的第3.2.2节:

以下,定义用表示的列元素,使得根据等式(6)的正交条 件还满足

其中,对于C≥(N+1)2,n′≤N并且n≤N。

如果假设球面麦克风阵列具有在球的表面上接近均匀分布的炭精盒并 且炭精盒的数量大于0,则

成为有效表达式。将(9)代入(8),得到将要在下面被考虑的正交条件

其中,对于C≥(N+1)2,n′≤N并且n≤N。

处理的仿真

在刚性(硬性、固定)球上的球面麦克风阵列的完整的HOA处理链包 含:估计炭精盒的压力,计算HOA系数,以及对扬声器权数进行解码。其 基于:对平面波从麦克风阵列重构的权数w(k)必须等于从在等式(3)中给 出的平面波系数重构的参考权数wref(k)。

以下部分介绍将W(k)分解为参考权数wref(k)、空间混叠权数walias(k) 和噪声权数wnoise(k)。混叠是由对有限的阶N的连续的声场进行的采样造成 的,并且噪声对为每个炭精盒引入的空间不相关的信号部分进行仿真。对于 指定的麦克风阵列,无法移除空间混叠。

炭精盒信号的仿真

在上述的M.A.Poletti的论文的第2.2节的等式(19)中定义了在刚性球 的表面上的麦克风阵列的入射平面波的传递函数:

bn(kR)=4πin+1(kR)2dhn(1)(kr)dkr|kr=kR,---(11)

其中,是第一类Hankel函数,半径r等于球的半径R。根据使得压力 分散在刚性球上的物理原理推出该传递函数,这表示辐射速率在刚性球的表 面上消失。换言之,进来的和分散的声场的辐射导出量(radial derivation) 的叠加为零,参见《Fourier Acoustics》一书的第6.10.3节。

因此,对于从Ωs入射的平面波,在位置Ω处的在球的表面上的压力在 Moreau/Daniel/Bertet的论文的第3.2.1节的等式(21)中给出:

P(Ω,kR)=Σn=0Σm=-nnbn(kR)Ynm(Ω)dnm(k)=Σn=0Σm=-nnbn(kR)Ynm(Ω)Ynm(Ωs)*P0(k).---(12)

添加各向同性的噪声信号Pnoisec,k)以对换能器噪声进行仿真,其中, “各向同性”表示炭精盒的噪声信号是空间不相关的,这不包含在时域中的 相关性。压力可以被分为对麦克风阵列的最大阶N计算的压力Pretc,kR) 和来自剩余的阶的压力,参见在上述的Rafaely的论文《Analysis and  design……》中的第7节的等式(24)。来自剩余的阶的压力Paliasc,kR)被 称为空间混叠压力,因为麦克风阵列的阶不足以重构这些信号分量。因此, 在炭精盒c记录的全部压力被定义为:

P(Ωc,kR)=Pref(Ωc,kR)+Palias(Ωc,kR)+Pnoise(Ωc,k)---(13a)=Σn=0NΣm=-nnbn(kR)Ynm(Ωc)Ynm(Ωs)*P0(k)+Σn=N+1Σm=-nnbn(kR)Ynm(Ωc)Ynm(Ωs)*P0(k)+Pnoise(Ωc,k)---(13b)

Ambisonics编码

通过在等式(14a)中给出的对等式(12)进行的求逆从在炭精盒的压 力得到Ambisonics系数参见上述的Moreau/Daniel/Bertet的论文的 第3.2.2节的等式(26)。使用等式(8)通过对球面谐波求 逆,并且通过它的逆,使传递函数bn(kR)等化:

如等式(14b)和(14c)所示,使用等式(14a)和(13a)可以将Ambisonics 系数分为参考系数混叠系数以及噪声系数

Ambisonics解码

最优化使用在原点处的得到的扬声器权数w(k)。假设所有的扬声器到原 点距离均相同,从而所有扬声器权数的和得到w(k)。等式(15)根据等式(1) 和(14b)提供w(k),其中,L是扬声器的数量:

等式(15b)示出W(k)还可以被分为三个权数wref(k)、walias(k)和wnoise(k)。 为了简化,此处不考虑在上述的Rafaely的论文《Analysis and design……》 的第7节的等式(24)中给出的定位误差。

在解码中,参考系数是阶n的综合产生的平面波将创建的权数。在下面 的等式(16a)中,将来自等式(13b)的参考压力Prefc,kR)代入等式(15a), 由此压力信号Paliasc,kR)和Pnoisec,k)被忽略(亦即,被设为零):

可以使用等式(8)消去c、n′和m′的和,使得等式(16a)可以被简化 为根据等式(3)的Ambisonics表示中的平面波的权数的和。因此,如果忽 略混叠和噪声信号,则可以根据麦克风阵列记录完美地重构阶N的平面波的 理论系数。

根据等式(15a)并仅使用来自等式(13b)的Pnoisec,k),得到的噪 声信号wnoise(k)的权数通过下式给出:

将来自等式(13b)的Paliasc,kR)项代入到等式(15a)并忽略其他压 力信号,得到:

因为索引n′大于N,所以不能通过来自等式(8)的正交化条件简化该 得到的混叠权数walias(k)。

对混叠权数的仿真需要以足够的准确度表示炭精盒信号的Ambisonics 阶。在上述的Moreau/Daniel/Bertet的论文的第2.2.2节的等式(14)中给出 了关于Ambisonics声场重构的截断误差的分析。对于

可以得到该声场的合理的准确度,其中,表示向上舍入到最近的整数。 该准确度用于仿真的频率上限fmax。因此,Ambisonics阶

被用于对每个波数的混叠压力进行的仿真。这得到在频率上限的可接受的准 确度,甚至对于低频,准确度也提高了。

对扬场器权数的分析

图1示出关于在刚性球上具有32个炭精盒的麦克风阵列(根据上述 Agmon/Rafaely的论文的Eigenmike被用于仿真)的来自方向Ωs=[0,0]T的 平面波的得到的扬声器权数中的扬声器权数分量分量a)wref(k)、b) wnoise(k)和c)walias(k)的功率。麦克风炭精盒在R=4.2cm的球的表面上 均匀地分布,使得正交条件得以满足。该阵列支持的最大的Ambisonics阶N 为4。根据Fliege、Ulrike Maier的《A Two-Stage Approach for Computing  Cubature Formulae for the Sphere》(技术报告,1996年,Fachbereich  Mathematik,Dortmund,德国),在上述的M.A Poletti的论文中 描述的模式匹配处理被用于得到关于25个均匀分布的扬声器位置的解码系 数http://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/ nodes/nodes.html示出了节点数量。

参考功率wref(k)在整个频率范围内是不变的。得到的噪声权数 Wnoise(k)在低频上显示出高功率,并在更高的频率上减少。通过方差为20dB (亦即,低于平面波功率的20dB)的正态分布的无偏伪随机噪声对噪声信 号或功率进行仿真。混叠噪声walias(k)在低频上可以被忽略,但是随着不 断上升的频率而增加,并且在10kHz以上时超过参考功率。混叠功率曲线的 斜率取决于平面波的方向。然而,对于所有的方向,平均趋势是一致的。

两个误差信号wnoise(k)和walias(k)使在不同的频率范围内的参考权 数失真。另外,误差信号彼此独立。因此,提出不考虑混叠信号使噪声信号 最小化。

对所有的进来的平面波的方向,使在参考权数和失真的参考权数之间的 均方误差最小化。忽略混叠信号walias(k)中的权数,因为在由Ambisonics 表示的阶进行了空间限带之后无法校正walias(k)。这等同于其中无法从被采 样并经空间限带的时间信号中移除混叠的时域混叠。

最优化–降噪

降噪使由噪声信号引入的均方误差最小化。在频域中使用维纳滤波器处 理计算每个阶n的补偿滤波器的频率响应。对于每个波数k,根据参考权数 wref(k)和经滤波器并失真的权数Wref(k)+Wnoise(k)得到误差信号。如前所 述,此处忽略混叠误差walias(k)。使用最优化传递函数F(k)对失真的权数进 行滤波,其中,在频域中通过失真信号和传递函数F(k)的相乘实施该处理。 通过使参考权数与经滤波并失真的权数之间的平方误差的期望值最小化推 出零相位传递函数F(k):

E{|wref(k)-F(k)(wref(k)+wnoise(k))|2}=---(21a)=E{|wref(k)|2}-2F(k)E{|wref(k)|2}+F(k)2(E{|wref(k)|2}+E{|wnoise(k)|2})---(21b)

然后,通过下式给出作为维纳滤波器而众所周知的该解决方案:

F(k)=11+E{|wnoise(k)|2}E{|wref(k)|2}---(23)

平方绝对权数的期望值E表示权数的平均信号功率。因此,wnoise(k)和 wref(k)的功率的分式表示关于每个波数k的经重构的权数的信噪比的倒 数。在以下部分解释wnoise(k)和wref(k)的功率的计算。

根据上述的Rafaely的论文《Analysis and design……》的附录部分的等 式(34)从等式(16)得到参考权数wref(k)的功率:

E{|wref(k)|2}=14πΩsS2|Σn=0NΣm=-nnΣl=1LDnm(Ωl)Ynm(Ωs)*P0(k)|2dΩs---(24a)=14πΣn=0NΣn=0NΣm=-nnΣm=-nnΣl=1LΣl=1LDnm(Ωl)Dnm(Ωl)*|P0(k)|2×ΩsS2Ynm(Ωs)*Ynm(Ωs)s---(24b)=|P0(k)|24πΣn=0NΣm=-nn|Σl=1LDnm(Ωl)|2---(24c)=Σn=0NEn{|wref(k)|2}.---(24d)

等式(24c)示出功率等于对所有的扬声器加在一起的平方绝对HOA系数 的和。假设|P0(k)|2是平均声场能量并且P0(k)对于所有的Ωs均不变。 这表示wref(k)的功率可以被分为每个阶n的功率的和。如果这对于wnoise(k) 的期望值也是真的,则可以对每个阶n分别根据等式(21)使误差信号最小 化,以便得到全局的最小值。

在上述的Rafaely的论文《Analysis and design……》的第7节的等式(28) 中给出wnoise(k)的功率的推导。因为噪声信号是空间不相关的,所以可以为 每个炭精盒独立地计算期望值。根据等式(17)通过下式推出噪声权数的期 望的功率:

为了达到从每个阶n的功率的和中分离噪声功率权数,制定一些限制。如果 扬声器c的和可以被简化为等式(10),则可以得到该分离。

因此,炭精盒位置必须接近均等地分布在球的表面上,使得等式(9) 中的条件得以满足。而且,对于所有炭精盒,噪声压力的功率必须是不变的。 然后,噪声功率独立于Ωc并且可以从c的和中排除。这样,对于所有炭精 盒,通过下式定义不变的噪声功率:

|Pnoise(k)|2=|Pnoise(Ωc,k)|21C2|Σc=1CPnoise(Ωc,k)|2---(26)

施加这些限制,等式(25b)简化为:

E{|wnoise(k)|2}=4πCΣn=0NΣm=-nn|Σl=1LDnm(Ωl)|2|Pnoise(k)|2|bn(kR)|2=Σn=0NEn{|wnoise(k)|2}.---(27)

因为阵列应当均匀地对在球上的压力进行采样,所以对于球面麦克风阵 列,一般均满足对炭精盒位置的限制。对于由模拟处理(例传感器噪声或放 大)以及对每个麦克风信号的模数转换产生的噪声,可以一直假设不变的噪 声功率。因此,所述限制对于一般的球面麦克风阵列是有效的。

根据等式(21b)的期望值是参考功率与噪声功率的线性叠加。每个权 数的功率均可以被分为每个阶n的功率的和。因此,根据等式(21b)的期 望值也可以被分为每个阶n的叠加。这表示可以根据每个阶n的最小值推出 全局的最小值,使得可以为每个阶n定义一个最优化传递函数Fn(k):

E{|wref(k)|2}-2F(k)E{|wref(k)|2}+F(k)2(E{|wref(k)|2}+E{|wnoise(k)|2})Σn=0NEn{|wref(k)|2}-2Fn(k)En{|wref(k)|2}+Fn(k)2(En{|wref(k)|2}+En{|wnoise(k)|2})---(28)

通过结合等式(23)、(24)和(25)从传递函数F(k)得到传递函数Fn(k)。 N+1个最优化传递函数被定义为:

Fn(k)=11+En{|wnoise(k)|2}En{|wref(k)|2}---(29a)=11+(4π)2|Pnoise(k)|2C|bn(kR)|2|P0(k)|2---(29b)=|bn(kR)|2|bn(kR)|2+(4π)2CSNR(k).---(29c)

传递函数Fn(k)取决于炭精盒的数量以及波数k的信噪比:

SNR(k)=|P0(k)|2|Pnoise(k)|2.---(30)

另一方面,传递函数独立于Ambisonics解码器,这表示其对于三维 Ambisonics解码和定向音束成形是有效的。因此,还可以不考虑解码系数 的和,根据Ambisionics系数的均方误差推出传递函数。因为功 率|P0(k)|2随时间变化,可以根据记录的信号的当前SNR(k)设计出自适应的传 递函数。在“最优的Ambisonics处理”一节中进一步地说明该传递函数设计。

传递函数Fn(k)与来自在上述的Moreau/Daniel/Bertet论文中的第4节的 等式(32)的Tikhonov正则化传递函数较表明可以从 等式(29c)推出正则化参数λ。Tikhonov正则化的对应的参数

λ=(4π)CSNR(k)---(31)

关于指定的SNR(k),使Ambisonics记录的平均重构误差最小化。

在图2中,传递函数Fn(k)被分别示为Ambisonics阶0到4的函数“a” 到“e”,其中,传递函数具有对于每个阶n,对更高阶增大截止频率这样的 高通特征。20dB的不变的SNR(k)被用于传递函数设计。截止频率以在上述 的Moreau/Daniel/Bertet的论文中的第4.1.2节中所述的正则化参数λ衰减。 因此,对于低频,需要高SNR(k)以得到更高阶Ambisonics系数。

根据下式计算最优化的权数w′(k):

最优的Ambisonics处理

在对Ambisonics麦克风阵列处理的实际的实现中,根据下式得到最优化 的Ambisonics系数

其中,包含炭精盒C的和以及每个阶n的自适应传递函数以及波数k。该和 将在球的表面上所采样的压力分布转换为Ambisonics表示,对于宽带信号, 可以在时域中实施。该处理步骤将时域压力信号P(Ωc,t)转换为第一 Ambisonics表示

在第二处理步骤中,最优化传递函数

Fn,array(k)=Fn(k)bn(kR)---(34)

根据第一Ambisonics表示重构方向信息项。传递函数bn(kR)的倒数将 转换为方向系数其中,假设所采样的声场是通过分散在球的表 面上的平面波的叠加而创建的。系数表示在上述的Rafaely的论文 《Plane-wave decomposition……》的第3节的等式(14)中所述的声场的 平面波分解,这种表示主要用于Ambisonics信号的传送。取决于SNR(k), 最优化传递函数Fn(k)降低更高阶系数的影响,以便移除被噪声掩盖的HOA 系数。

可以将对系数的处理看作是线性滤波处理,其中,用Fn,array(k)确 定滤波器的传递函数。这可以在频域以及时域中实施。FFT可以被用于将系 数变换到频域,用于连续乘以传递函数Fn,array(k)乘积的逆FFT得到 时域系数该传递函数处理也被称为使用重叠相加或重叠保留方法的 快速卷积。可替代地,可以通过FIR滤波器逼近线性滤波器,其系数可以通 过以下方式根据传递函数Fn,array(k)计算出:使用逆FFT将其变换到时域, 实施环形移位,并且对得到的滤波器脉冲响应施加锥形窗口以平滑对应的传 递函数。然后,在时域中通过传递函数Fn,array(k)的时域系数与n和m的每 个组合的系数的卷积实施线性滤波处理。

在图3中图示了本发明的自适应的基于框的Ambisonics处理。在上部的 信号路径中,在步骤或阶段31中使用等式(14a)将麦克风炭精盒信号的时 域压力信号P(Ωc,t)转换为Ambisonics表示由此,由麦克风传递函 数bn(kR)进行的划分不执行(从而,计算而不是),而是在步骤 /阶段32中执行。然后,步骤/阶段32在时域或频域中实施所述的线性滤波 操作以便得到系数第二处理路径被用于传递函数Fn,array(k)的自动的 自适应滤波器设计。步骤/阶段33实施对所考虑的时间段(亦即,一组采样) 的信噪比SNR(k)的估计。对于有限数量的离散波数k在频域中实施该估计。 因此,必须例如使用FFT将所涉及的压力信号P(Ωc,t)变换到频域。SNR(k) 值是由两个功率信号|Pnoise(k)|2和|P0(k)|2指定的。噪声信号的功率|Pnoise(k)|2对于指定的阵列是不变的,其表示由炭精盒产生的噪声。必须根据压力信号 P(Ωc,t)估计出平面波的功率|P0(k)|2。在“SNR估计”一节中进一步地说明 该估计。根据所估计的SNR(k),在步骤/阶段34中设计具有n≤N的传递函 数Fn,array(k)。滤波器设计包含在等式(29c)中给出的维纳滤波器以及逆阵 列响应或逆传递函数1/bn(kR)的设计。有利地,维纳滤波器限制了逆阵列响 应的传递函数的高度放大。这得到传递函数Fn,array(k)的可管理的放大。然后, 该滤波器实现适用于在步骤/阶段32的时域或频域中的对应的线性滤波器处 理。

SNR估计

将根据所记录的炭精盒信号估计SNR(k)值:其取决于平面波的平均功率 |P0(k)|2以及噪声功率|Pnoise(k)|2

在没有任何声源使得可以假设|P0(k)|2=0的安静的环境中根据等式 (26)得到噪声功率。对于可调节的麦克风放大器,应当为若干放大器增益 测量噪声功率。然后,该噪声功率可以适用于对若干记录所使用的放大器增 益。

根据在炭精盒测量的压力Pmicc,k)估计平均源功率|P0(k)|2。这通过比 较来自等式(13)的在炭精盒的压力的期望值与由下式定义的在炭精盒的所 测量的平均信号功率来实施:

E{|Psig(k)|2}=1C2|Σc=1CPmic(Ωc,k)|2-|Pnoise(k)|2.---(35)

必须从所测量的功率中减于噪声功率|Pnoise(k)|2以得到期望值Psig(k)。

还可以通过下式为来自等式(13)的在炭精盒的压力的Ambisonics表示 估计期望值Psig(k):

E{|Psig(k)|2}=1C2E{|Σc=1CP(Ωc,kR)|2}---(36a)=14πC2ΩsS2|Σc=1CΣn=0Σm=-nnbn(kR)Ynm(Ωc)Ynm(Ωs)*P0(k)|2dΩs---(36b)=|P0(k)|24πC2Σn=0Σm=-nn|bn(kR)|2Σc=1CΣc=1CYnm(Ωc)Ynm(Ωc)*.---(36c)

在等式(36b)中,可以对绝对量的扩展施加来自等式(4)的正交条件以推 出等式(36c)。由此,根据球面谐波的互相关性估计出平均信号功 率。结合传递函数bn(kR),这表示在炭精盒位置处的压力场的相干性。

等式(35)和(36)的等化根据所记录的压力信号Pmicc,k)和所估计 的噪声功率|Pnoise(k)|2得到对|P0(k)|2的估计,其在等式(37)中呈现:

|P0(k)|2=|Σc=1CPmic(Ωc,k)|2-C2|Pnoise(k)|214πΣn=0Σm=-nn|bn(kR)|2Σc=1CΣc=1CYnm(Ωc)Ynm(Ωc).---(37)

等式(37)中的分母对于指定的麦克风阵列的每个波数k是不变的。因 此,可以只针对要被存储在查找表中的或为每个波数k存储的Ambisonics 阶Nmax计算一次。

最后,通过下式根据炭精盒信号P(Ωc,kR)得到SNR(k)值:

SNR(k)=|Σc=1CPmic(Ωc,k)|2-|Σc=1CPnoise(Ωc,k)|214πC2|Σc=1CPnoise(Ωc,k)|2Σn=0Σm=-nn|bn(kR)|2Σc=1CΣc=1CYnm(Ωc)Ynm(Ωc).---(38)

还可以根据线性麦克风阵列处理得知根据指定炭精盒信号的平均源功率的 估计。炭精盒信号的互相关性被称为声场的空间相干性。对于线性阵列处理, 根据平面波的连续表示确定该空间相干性。仅以Ambisonics表示的形式得知 对在刚性球上的分散的声场的描述。因此,对SNR(k)的所呈现的估计基于 确定在刚性球的表面上的空间相干性的新处理。

因此,对于模式匹配的Ambisonics解码器,在图4中示出从图2的最优 化滤波器得到的平均功率分量w′(k)。噪声功率降低至-35dB,直至频率为 1kHz时。在高于1kHz时,噪声功率线性地增加到-10dB。得到的噪声功率 小于Pnoisec,k)=-20dB,直至频率约为8kHz时。在高于10kHz时,全部功 率上升10dB,这是由混叠功率造成的。在高于10kHz时,对于半径等于R 的球,麦克风阵列的HOA阶不能充分地描述在表面上的压力分布。因此, 由所得到的Ambisonics系数造成的平均功率大于参考功率。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号