首页> 中国专利> 降低调频无线电广播噪声中的伪不相关性

降低调频无线电广播噪声中的伪不相关性

摘要

本文涉及音频信号处理,特别地涉及用于改进FM立体声无线电接收器的音频信号的系统及相应方法,在上下文中,一个方面涉及对所接收到的侧边信号的噪声进行估计和在参数化立体声参数中对这样的噪声进行补偿。描述了一种用于从双声道音频信号生成参数化立体声参数的系统。双声道音频信号可表示为代表相应左右音频信号的中央信号和侧边信号。该系统包括:噪声估计级,其被配置成确定侧边信号的噪声的影响因子特性;以及参数化立体声参数估计级,其被配置成确定参数化立体声参数;其中,确定参数化立体声参数是基于双声道音频信号和影响因子的。

著录项

  • 公开/公告号CN103069721A

    专利类型发明专利

  • 公开/公告日2013-04-24

    原文格式PDF

  • 申请/专利权人 杜比国际公司;

    申请/专利号CN201180040891.8

  • 申请日2011-08-16

  • 分类号H04B1/16;G10L19/008;H04S1/00;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人陈炜

  • 地址 荷兰祖伊杜斯特

  • 入库时间 2024-02-19 19:54:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-08-02

    未缴年费专利权终止 IPC(主分类):H04B1/16 授权公告日:20160323 终止日期:20180816 申请日:20110816

    专利权的终止

  • 2016-03-23

    授权

    授权

  • 2013-05-29

    实质审查的生效 IPC(主分类):H04B1/16 申请日:20110816

    实质审查的生效

  • 2013-04-24

    公开

    公开

说明书

相关申请的交叉引用

本申请要求于2010年8月24日提交的美国专利临时申请61/376,567的优先权,其全部内容通过引用并入本文中。

技术领域

本文涉及音频信号处理,尤其涉及一种用于对调频立体声无线电接收器的音频信号进行改进的系统及相应方法。在本文本中,一个方面涉及对所接收到的侧边信号(side signal)中的噪声进行估计以及以参量立体声参数对这样的噪声进行补偿。

背景技术

在模拟FM(调频)立体声无线电系统中,以中央-侧边(Mid-Side,M/S)呈现法(即作为中央声道(M)和侧边声道(S))输送音频信号的左声道(L)和右声道(R)。中央声道M对应于L与R的和信号,例如M=(L+R)/2,而侧边声道S对应于L与R的差信号,例如S=(L-R)/2。为了传输,侧边声道S被调制到38kHz的抑制载波上并被添加至基带中央信号M以形成向后兼容的立体声多路复用信号。然后,使用该多路复用信号来调制FM发射器的HF(高频)载波,该HF载波通常工作于87.5MHz至108MHz之间的范围内。

当接收品质下降(即,无线电信道上的信噪比减小)时,S声道通常比M声道受损更多。在许多FM接收器的实现中,当接收状况太嘈杂时,S声道被静音。这意味着在差的HF无线电信号的情况下接收器从立体声退回到单声道。

即使在中央信号M具有可接受的品质的情况下,侧边信号S也可能是有噪声的,因此当侧边信号S被混合到输出信号的左声道和右声道(其例如根据L=M+S和R=M-S得出)中时,侧边信号S可能会严重降低整体音频品质。当侧边信号S仅变差至中间品质时,存在两种选择:接收器选择接受与侧边信号S相关联的噪声并输出包括有嘈杂的左信号和右信号的真实立体声信号,或者接收器丢弃侧边信号S并退回到单声道。

参数化立体声(PS)编码是一种来自极低比特率音频编码领域的技术。PS允许与附加的PS侧边信息(即PS参数)相结合来将双声道立体声音频信号编码为单声道缩混(downmix)信号。获得单声道缩混信号作为立体声信号的两个声道的组合。PS参数使得PS解码器能够根据单声道缩混信号和PS侧边信息来重建立体声信号。通常,PS参数随时间和频率变化,并且通常在包含QMF滤波器组的混合滤波器组域中执行PS解码器中的PS处理。2004年10月在意大利那不勒斯召开的数字音效研讨会(DAFx)的论文集的第163~168页中的Heiko Purnhagen发表的文献“LowComplexity Parametric Stereo Coding in MPEG-4”描述了用于MPEG-4的示例性PS编码系统,其关于参数化立体声的讨论通过引用并入本文中。参数化立体声例如由MPEG-4音频支持。在MPEG-4标准化文献ISO/IEC14496-3:2005(MPEG-4音频,第三版)的章节8.6.4和附录8.A和8.C中讨论了参数化立体声。出于各种目的,通过引用将所述标准化文献的这些部分并入本文中。参数化立体声也被用在MPEG环绕标准(参见文献ISO/IEC23003-1:2007,MPEG Surround)中。此外,出于各种目的,通过引用将所述文献并入本文中。以下文献中讨论了参数化立体声编码系统的其它示例:Frank Baumgarte和Christof Faller发表于2003年11月的IEEE语音和音频处理会刊的第11卷第6册的第509~519页上的文献“Binaural Cue Coding-Part Ⅰ:Psychoacoustic Fundamentals andDesign Principles,”;以及Christof Faller和Frank Baumgarte发表于2003年11月的IEEE语音和音频处理会刊的第11卷第6册的第520~531页上的文献“Binaural Cue Coding–Part Ⅱ:Schemes andApplications,”。在后面两篇文献中使用了术语“双耳线索编码(binauralcue coding)”,其是参数化立体声编码的示例。

在本文中描述了一种方法和系统,其是以使用PS参数生成立体声信号为基础的。即使在接收到品质差的侧边信号的情况下,也使用PS参数生成低噪声的立体声信号。在本文本中,分析了侧边信号中的噪声对PS参数的影响并描述了一种如何补偿这样的影响的方法。

发明内容

根据一个方面,描述了一种被配置成生成输出立体声信号和/或被配置成根据双声道音频信号来确定参数化立体声参数的系统。换句话说,该系统可以被配置成确定至少一个参数化立体声参数。可以在作为例如无线通信设备的一部分的FM立体声无线电接收器处接收双声道音频信号。所接收到的双声道音频信号可呈现为中央信号和侧边信号。换句话说,双声道音频信号可以包括中央信号和侧边信号,或可以包括可表示为中央信号和侧边信号的信号。中央信号和侧边信号可以代表相应的左右音频信号。中央信号和侧边信号可以由左信号和右信号得出。如此,双声道音频信号可以包括可以从中得出中央信号和侧边信号的信息。在一个实施方式中,中央信号M和侧边信号S与左音频信号L和右音频信号R按照如下方式关联:M=(L+R)/2,及S=(L-R)/2。

输出立体声信号通常可表示为左信号和右信号。可替代地,输出立体声信号可以被称为双声道输出信号。该双声道输出信号可以承载单声道音频信号或立体声音频信号。特别地,如果双声道输出信号的左信号与双声道输出信号的右信号对应,则双声道输出信号通常承载单声道音频信号。

该系统可以包括噪声估计级,该噪声估计级被配置成确定侧边信号的噪声的影响因子特性。如上所概述的,可以从所接收到的双声道音频信号中获得侧边信号。特别地,影响因子可以是侧边信号的功率谱的特性,例如侧边信号的一个或更多个信号帧的功率谱的特性。更特别地,影响因子可以是侧边信号的谱平坦度的特性。在一个实施方式中,从侧边信号的谱平坦度测量值得出影响因子,例如从侧边信号的一个或更多个信号帧的谱平坦度测量值得出影响因子。

该系统可以包括参数化立体声参数估计级,该参数化立体声参数估计级被配置成确定参数化立体声参数或至少一个参数化立体声参数。参数化立体声参数估计级可以被配置成基于双声道音频信号的信号帧来确定参数化立体声参数。换句话说,可以使用所接收到的双声道音频信号的摘录(excerpt)来确定参数化立体声参数,例如表示声道电平差的参数和/或表示声道间互相关的参数。更一般地讲,参数化立体声参数估计级可以被配置成确定如下参数化立体声参数,该参数化立体声参数表示被应用于输出立体声信号的生成的去相关的量。参数化立体声参数估计级可以被配置成确定双声道音频信号的每个后继帧的新的参数化立体声参数。可替代地或此外,参数化立体声参数估计级可以被配置成基于(即通过考虑)影响因子来确定参数化立体声参数。在一个实施方式中,参数化立体声参数包括表示左右音频信号之间的相关的声道间互相关参数。

参数化立体声参数估计级可以被配置成:如果影响因子表示侧边信号的高度的谱平坦度,则对有噪声的参数化立体声参数进行修改,以减小应用于立体声信号的生成的去相关的量。参数化立体声参数估计级可以特别地根据依赖于有噪声的参数化立体声参数和影响因子的函数来确定参数化立体声参数。

该系统可以包括上混级(upmix stage),该上混级被配置成基于辅助音频信号和参数化立体声参数来生成输出立体声信号。可以从双声道音频信号获得辅助音频信号。特别地,可以从双声道音频信号的相应帧获得辅助音频信号的帧。在一个实施方式中,辅助音频信号被确定为(L+R)/a,其中a为实数,例如2。也就是说,辅助音频信号可以对应于双声道音频信号中所包括的中央信号。

参数化立体声参数估计级可以被配置成使用左右音频信号的第一信号帧的样本来确定有噪声的声道间互相关参数。特别地,可以确定左音频信号的第一信号帧与右音频信号的第一信号帧之间的互相关。这可以通过使用例如本文中所概述的公式来实现。可以通过使用影响因子对有噪声的声道间互相关参数进行修改来确定声道间互相关参数。特别地,如果影响因子表示侧边信号的高的谱平坦度,则可以使有噪声的声道间互相关参数增加。

换句话说,参数化立体声参数估计级可以被配置成根据依赖于有噪声的声道间互相关参数和影响因子的函数来确定声道间互相关参数。如果影响因子值为“0”,则该函数可以具有值“0”。如果影响因子值为“1”,则该函数可以具有值“1”。在值“0”与“1”之间,该函数可以是关于其变量“有噪声的声道间互相关参数”和“影响因子”连续的。如果声道间互相关参数覆盖“-1”至“1”的范围,则上述关于该函数的约束条件是特别相关的,其中,声道间互相关值“-1”表示左右声道之间为负互相关,“0”表示左右声道之间无互相关,并且其中,声道间互相关值“1”表示左右声道之间完全互相关。此外,影响因子可以覆盖“0”至“1”的范围,其中,影响因子值“0”表示低平坦度,并且其中,影响因子值“1”表示高平坦度。

在一个实施方式中,参数化立体声参数估计级可以被配置成使用如下函数来根据有噪声的声道间互相关参数ICC确定声道间互相关参数ICC_new:ICC_new=(影响因子)+(1-影响因子)*ICC。

噪声估计级可以被配置成计算侧边信号的第二信号帧的功率谱。第一信号帧和第二信号帧可以是同时发生(coincide)的,即用于确定有噪声的声道间互相关参数的信号帧与用于确定侧边信号的功率谱的信号帧可以同时发生。如上所述,可以使用功率谱来确定侧边信号的谱平坦度,并由此获得关于包括在侧边信号内的噪声的水平的指示。噪声估计级可以被配置成对功率谱的斜率进行补偿,由此得到补偿后的功率谱。用于对功率谱进行补偿的斜率可以被预先确定为例如多个测试侧边信号的功率谱的平均斜率。这些测试侧边信号可以是单声道信号(例如单声道语音信号)的侧边信号,由此得到关于包括在单声道信号(例如单声道语音信号)中的侧边信号的典型/平均斜率。可替代地或此外,可以使用侧边信号的第二信号帧来确定用于对功率谱进行补偿的斜率。这可以使用线性回归技术来实现。

噪声估计级可以被配置成确定补偿后的功率谱的谱平坦度测量(SFM)值。该SFM值可以被确定为补偿后的功率谱的几何平均与补偿后的功率谱的算术平均之比。应当注意的是,通常根据并针对侧边信号的多个后继信号帧来确定多个SFM值。由于SFM值可以根据并针对当前信号帧来确定,所以它们可以被称为瞬时SFM值。噪声估计级可以被配置成对SFM值(或多个SFM值)进行映射并基于映射后的SFM值来确定第一影响因子。SFM值(或多个SFM值)可以被映射到预定的比例或范围,以确定第一影响因子。换句话说,可以根据SFM值来确定第一影响因子。从而,可以根据多个SFM值来确定多个第一影响因子。

作为映射的结果,可以将第一影响因子映射到“0”至“1”的范围。特别地,噪声估计级可以被配置成:对于低于第一较低阈值的SFM值,将第一影响因子设置为“0”;和/或对于高于第一较高阈值的SFM值,将第一影响因子设置为“1”;和/或将从第一较低阈值到第一较高阈值的SFM值缩放到“0”至“1”的范围,由此对SFM值进行映射,其中,第一影响值对应于映射后的SFM值。可以执行线性缩放。

噪声估计级可以被配置成通过考虑与侧边信号的多个信号帧对应的多个SFM值来确定平滑的SFM值。例如,可以通过考虑当前帧的SFM值和(紧接的)前一帧的平滑的SFM值来递归地确定平滑的SFM值。如此,可以根据并针对多个信号帧来确定多个平滑的SFM值。可以以与SFM值相似的方式来映射平滑的SFM值。特别地,平滑的SFM值可以被映射到预定的比例或范围。可以使用映射后的平滑的SFM值来确定第二影响因子。换句话说,可以根据平滑的SFM值来确定第二影响因子。从而,可以根据多个平滑的SFM值来确定多个第二影响因子。

以与确定第一影响因子的方式相似的方式,噪声估计级可以被配置成将第二影响因子映射到“0”至“1”的范围。该映射可以包括如下步骤:对于低于第二较低阈值的平滑的SFM值,将第二影响因子设置为“0”;和/或对于高于第二较高阈值的平滑的SFM值,将第二影响因子设置为“1”;和/或将从第一较低阈值到第一较高阈值的平滑的SFM值缩放到“0”至“1”的范围。

作为结果,可以确定第一影响因子和第二影响因子。通常,可以使用基于瞬时SFM值的第一影响值(或多个第一影响值)来检测短的噪声脉冲串(noise burst)。可以使用基于平滑的SFM值的第二影响值(或多个第二影响值)来检测静态噪声。为了使得第一影响值和第二影响值适于其各自的目的,第一和第二较低阈值和/或第一和第二较高阈值可以被设置得不同。在一个实施方式中,第一较高阈值高于第二较高阈值,以更好地检测短的噪声脉冲串。

噪声估计级可以被配置成基于第一影响因子和第二影响因子来确定影响因子。在一个实施方式中,噪声估计级被配置成选择第一影响因子和第二影响因子中的较大的一个作为影响因子。可替代地,可以使用第一影响因子和第二影响因子的加权平均作为影响因子。

该系统还可以包括支持参数化立体声的音频编码器,其中该音频编码器可以包括参数化立体声编码器,参数化立体声参数估计级为参数化立体声编码器的一部分。可替代地或此外,所述系统被配置成检测FM立体声接收器选择立体声无线电信号的单声道输出,或者所述系统可以被配置成检测差的无线电接收。当FM立体声接收器切换至单声道输出或者发生差的无线电接收时,立体声上混级可以使用一个或更多个上混参数,所述一个或更多个上混参数基于来自参数化立体声参数估计级的一个或更多个先前估计的参数化立体声参数,例如声道间互相关参数。

根据又一个方面,描述了一种FM立体声无线电接收器。该FM立体声无线电接收器可以被配置成接收包括或可表示为中央信号和侧边信号的FM无线电信号。此外,FM立体声无线电接收器可以包括具有本文所概述的任何一个或更多个特征和功能的系统。

根据另一个方面,描述了一种移动通信设备,例如移动电话或智能电话。该移动通信设备可以包括FM立体声接收器,该FM立体声接收器被配置成接收包括或可表示为中央信号和侧边信号的FM无线电信号。此外,该移动通信设备可以包括根据本文中所概述的任何一个或更多个特征和功能的系统。

根据又一个方面,描述了一种用于根据双声道音频信号来生成输出立体声信号和/或用于根据双声道音频信号来确定一个(或至少一个)参数化立体声参数的方法。双声道音频信号可以表示为或可以包括中央信号和侧边信号,其中,中央信号和侧边信号可以代表相应的左右音频信号。所述方法可以包括如下步骤:确定侧边信号的噪声的影响因子特性,例如谱平坦度特性。所述方法可以确定参数化立体声参数(或至少一个参数化立体声参数),例如表示左右音频信号之间的相关的声道间互相关参数。参数化立体声参数的确定可以基于双声道音频信号和影响因子。所述方法可以包括如下步骤:基于辅助音频信号和参数化立体声参数来生成输出立体声信号,其中辅助音频信号可以从双声道音频信号获得。

根据又一个方面,描述了一种软件程序。所述软件程序可以适于在处理器上执行并且当在计算设备上执行时用于执行本文中所概述的方法步骤。

根据另一个方面,描述了一种存储介质。所述存储介质可以包括适于在处理器上执行并且当在计算设备上执行时用于执行本文中所概述的方法步骤的软件程序。

根据又一个方面,描述了一种计算机程序产品。所述计算机程序可以包括当在计算机上执行时用于执行本文中所概述的方法步骤的可执行指令。

应当注意的是,包括本专利申请中所概述的优选实施方式的方法和系统可以单独使用或者可以与本文中所公开的其他方法和系统结合使用。此外,本专利申请中所概述的方法和系统的所有方面可以任意组合。特别地,所附权利要求的特征可以以任意方式彼此组合。

附图说明

下文中,参照附图通过说明性示例来说明本发明,在附图中:

图1示出了用于改进FM立体声无线电接收器的立体声输出的示意性实施例;

图2示出了基于参数化立体声的构思的音频处理设备的实施例;

图3示出了具有PS编码器和PS解码器的基于PS的音频处理设备的另一个实施例;

图4示出了图3的音频处理设备的扩展版本;

图5示出了图4的PS编码器和PS解码器的实施例;

图6示出了在FM接收器仅有单声道输出的情况下用于生成伪立体声的音频处理设备的另一实施例;

图7示出了在FM接收器的输出处在立体声重放中发生短时信号丢失(short drop-out);

图8示出了具有误差补偿的高级PS参数估计级;

图9A示出了用于对ICC参数进行补偿的示例性噪声补偿级;

图9B更加详细地示出了示例性噪声补偿级;

图10示出了用于示例性音频信号的功率谱;

图11示出了用于确定可用于对ICC参数进行补偿的影响因子的示例性过程;

图12示出了针对从立体声音乐片段转换到单声道语音片段的示例性音频信号的平滑谱平坦度测量值及其相应的影响因子;以及

图13示出了基于HE-AAC v2编码器的音频处理设备的另一实施例。

具体实施方式

图1示出了用于改进FM立体声无线电接收器1的立体声输出的简化示意性实施例。如在背景部分所讨论的,在FM无线电中,立体声信号通过设计被传输为中央信号和侧边信号。在FM接收器1中,侧边信号用于在FM接收器1的输出处建立左声道L与右声道R之间的立体声差(至少在接收足够好并且侧边信号信息未被静音的情况下)。左声道L和右声道R可以是数字信号或模拟信号。为了改进FM接收器的音频信号L、R,使用了音频处理设备2,该音频处理设备2在其输出端处生成立体声音频信号L′和R′。音频处理设备2对应于一种能够使用参数化立体声来对所接收到的FM无线电信号进行降噪的系统。优选地在数字域执行设备2中的音频处理;因此,在FM接收器1与音频处理设备2之间为模拟接口的情况下,在设备2中的数字音频处理之前使用模-数转换器。FM接收器1和音频处理设备2可以被集成在同一半导体芯片上或可以是两个半导体芯片的一部分。FM接收器1和音频处理设备2可以是无线通信设备(例如移动电话、个人数字助理(PDA)或智能手机)的一部分。在该情况下,FM接收器1可以是具有附加的FM无线电接收器功能的基带芯片的一部分。

代替在FM接收器1的输出和设备2的输入处使用左/右表现方式,可以在FM接收器1与设备2之间的接口处使用中央/侧边(mid/side)表现方式(参见图1中的用于中央/侧边表现方式的M、S,以及用于左/右表现方式的L、R)。在FM接收器1与设备2之间的接口处的该中央/侧边表现方式可以导致较少的工作,这是因为FM接收器1已接收了中央/侧边信号并且音频处理设备2可以直接对中央/侧边信号进行处理而不用进行缩混(downmixing)。如果FM接收器1与音频处理设备2紧密集成,特别地,如果FM接收器1和音频处理设备2被集成在同一半导体芯片上,则中央/侧边表现方式会是有利的。

可选地,可以使用表示无线电接收状况的信号强度信号6来调整音频处理设备2中的音频处理。随后将在本说明书中对此进行描述。

FM无线电接收器1和音频处理设备2的组合对应于具有集成的降噪系统的FM无线电接收器。

图2示出了基于参数化立体声的概念的音频处理设备2的实施例。设备2包括PS参数估计级3。参数估计级3被配置成基于待改进的输入音频信号(其可以为左/右表现方式或中央/侧边表现方式)来确定PS参数5。除其他参数以外,PS参数5可以包括表示声道间强度差(IID或也称作CLD(channel level difference)声道电平差)的参数和/或表示声道间互相关(ICC)的参数。优选地,PS参数5是随时间和频率变化的。在参数估计级3的输入处为M/S表现方式的情况下,参数估计级3仍然可以确定与L/R声道相关的PS参数5。

从输入信号中获得音频信号DM。在输入音频信号已经使用中央/侧边表现方式的情况下,音频信号DM可以直接对应于中央信号。在输入音频信号具有左/右表现方式的情况下,通过对音频信号进行缩混来生成音频信号。优选地,缩混之后所得到的信号DM对应于中央信号M并且可以由下述等式来生成:

DM=(L+R)/a,例如,其中a=2,

即,缩混信号DM可以对应于L信号和R信号的平均值。对于不同的a值,L信号和R信号的平均值被放大或缩减。

该设备还包括上混级4,上混级4也称作立体声混合模块或立体声上混器。上混级4被配置成基于音频信号DM和PS参数5来生成立体声信号L′、R′。优选地,上混级4不仅使用DM信号而且还使用侧边信号或某种类型的伪侧边信号(未示出)。随后将在本说明书中结合图4和图5中的更多扩展实施例对此进行描述。

设备2基于如下构思:由于其噪声,所接收到的侧边信号对于通过将所接收到的中央信号和侧边信号简单组合来重建立体声信号而言可能噪声过多;然而,在这种情况下,侧边信号或在L/R信号中的侧边信号分量对于PS参数估计级3中的立体声参数分析可能仍然足够好。于是,可以使用所得到的PS参数5来生成立体声信号L′、R′,与直接在FM接收器1的输出处的音频信号相比,该立体声信号L′、R′具有降低的噪声水平。

因此,可以通过使用参数化立体声概念来“清除”差的FM无线电信号。FM无线电信号中的失真和噪声的主要部分位于在PS缩混中可能不使用的侧边声道(side channel)。然而,侧边声道即使在差的接收情况下也通常具有足够的品质用于PS参数提取。

在所有的下面的附图中,音频处理设备2的输入信号为左/右立体声信号。通过对音频处理设备2内的一些模块进行小的修改,音频处理设备2还可以处理用中央/侧边表现方式表示的输入信号。因此,此处所讨论的概念可以结合以中央/侧边表现方式表示的输入信号来使用。

图3示出了利用PS编码器7和PS解码器8的、基于PS的音频处理设备2的实施例。在本示例中,参数估计级3是PS编码器7的一部分,而上混级4是PS解码器8的一部分。术语“PS编码器”和“PS解码器”被用作用于描述设备2内的音频处理块的功能的名称。应当注意的是,全部音频处理均发生在同一FM接收器设备处。这些PS编码处理和PS解码处理可以紧密地耦合,并且术语“PS编码器”和“PS解码器”仅用于描述音频处理功能的载体。

PS编码器7基于立体声音频输入信号L、R来生成音频信号DM和PS参数5。可选地,PS编码器7还使用信号强度信号6。音频信号DM是单声道缩混信号并且优选地对应于所接收到的中央信号。当将L/R声道相加以形成DM信号时,所接收到的侧边声道的信息可以被完全排除在DM信号之外。因此,在该情况下,在单声道缩混DM中仅包含中央信息。因此,可以将来自侧边声道的任何噪声排除在DM信号之外。然而,由于编码器7通常以L=M+S和R=M-S作为输入(从而,DM=(L+R)/2=M),侧边声道是编码器7中的立体声参数分析的一部分。

单声道信号DM和PS参数5随后被用在PS解码器8中来重建立体声信号L′、R′。

图4示出了图3的音频处理设备2的扩展版本。此处,除了单声道缩混信号DM和PS参数之外,原始接收到的侧边信号S0也被传递到PS解码器8。该方法与来自PS编码的“残差编码(residual coding)”技术类似,并且允许在良好但并非完美的接收状况的情况下利用所接收到的侧边信号S0的至少一些部分(例如,某些频带)。所接收到的侧边信号S0优选地被用于单声道缩混信号对应于中央信号的情形。然而,在单声道缩混信号不对应于中央信号的情况下,可以使用更通用的残余信号来代替所接收到的侧边信号S0。该残余信号表示通过其缩混和PS参数来表示原始声道相关联的误差,并且该残余信号通常用在PS编码方案中。在下文中,对所接收到的侧边信号S0的使用的陈述也适用于残余信号。

图5示出了图4的PS编码器7和PS解码器8的实施例。PS编码器模块7包括缩混生成器9和PS参数估计级3。例如,缩混生成器9可以建立优选地对应于中央信号M的单声道缩混DM(例如,DM=M=(L+R)/a),并且还可以可选地生成对应于所接收到的侧边信号S0=(L-R)/a的第二信号。

PS参数估计级3可以将L输入和R输入之间的相关性和电平差估计为PS参数5。可选地,参数估计级接收信号强度6,该信号强度6可以是在FM接收器处的信号功率。该信息可以用于决定PS参数5的可靠性。在低可靠性的情况下,例如在低信号强度6的情况下,可以对PS参数5进行设置,使得输出信号L′、R′为单声道输出信号或伪立体声输出信号。在单声道输出信号的情况下,输出信号L′等于输出信号R′。在伪立体声输出信号的情况下,可以使用默认PS参数来生成伪立体声输出信号或默认立体声输出信号L′、R′。

PS解码器模块8包括立体声混合矩阵4a和去相关器10。去相关器接收单声道缩混DM并生成用作伪侧边信号的去相关信号S′。去相关器10可以由如所引用文献“Low Complexity Parametric Stereo Coding inMPEG-4”的章节4中所讨论的合适的全通滤波器来实现。在本实施例中,立体声混合矩阵4a是2×2上混矩阵。

依据所估计的参数5,立体声混合矩阵4a将DM信号与所接收到的侧边信号S0或去相关信号S′进行混合,以建立立体声输出信号L′和R′。可以依据表示接收状况的无线电接收指标(如信号强度6)在信号S0与信号S′之间进行选择。可替代地或此外,可以使用表示所接收到的侧边信号的品质的品质指标。该品质指标的一个示例可以是所接收到的侧边信号的估计出的噪声(功率)。在侧边信号包括较高的噪声的情况下,可以使用去相关信号S′来建立立体声输出信号L′和R′,而在低噪声的情况下,可以使用侧边信号S0。在本说明书中随后讨论用于估计所接收到的侧边信号的噪声的各种实施例。

优选地,根据下述矩阵方程来执行上混操作:

>LR=αβγδDMS>

此处,加权因子α、β、γ、δ确定信号DM和信号S的权重。单声道缩混DM优选地对应于所接收到的中央信号。公式中的信号S对应于去相关信号S′或所接收到的侧边信号S0。可以根据以下方式得出上混矩阵的元素(即加权因子α、β、γ、δ):例如,如所引用文章“Low ComplexityParametric Stereo Coding in MPEG-4”(参见章节2.2)所示;如所引用的MPEG-4标准文献ISO/IEC14496-3:2005(参见章节8.6.4.6.2)中所示;或者如MPEG环绕规范文献ISO/IEC23003-1(参见章节6.5.3.2)中所示。出于各种目的,所述文献的这些章节(以及在这些章节中引用的章节)通过引用并入本文中。

在某些接收状况下,FM接收器1仅提供单声道信号,而将所传输的侧边信号被静音。通常在接收状况非常差及侧边信号非常嘈杂时发生这种情况。在FM立体声接收器1已经切换到立体声无线电信号的单声道重放的情况下,上混级优选地使用盲从上混(blind upmix)的上混参数(如预设的上混参数),并生成伪立体声信号,即,上混级使用盲从上混的上混参数来生成立体声信号。

还存在FM立体声接收器1的以下实施例:在接收状况非常差的情况下,FM立体声接收器1切换到单声道重放。如果接收状况对于估计可靠的PS参数5而言太差,则上混级优选地使用盲从上混的上混参数并在此基础上生成伪立体声信号。

图6示出了在FM接收器1仅有单声道输出的情况下生成伪立体声的实施例。此处,使用单声道/立体声检测器13来检测设备2的输入信号是否是单声道的,即,L声道和R声道的信号是否相同。在FM接收器1单声道重放的情况下,单声道/立体声检测器13指示使用例如具有固定上混参数的PS解码器进行上混来得到立体声。换句话说:在该情况下,上混级4不使用来自PS参数估计级3(图6中未示出)的PS参数,而是使用固定的上混参数(图6中未示出)。

可选地,可以增加语音检测器14来指示所接收到的信号主要为语音还是音乐。该语音检测器14允许与盲从上混相关的信号。例如,该语音检测器14可以允许与上混参数相关的信号。优选地,针对语音可以使用一个或更多个上混参数,而针对音乐可以使用不同的一个或更多个上混参数。该语音检测器14可以由话音行为检测器(VAD)来实现。

严格地讲,图6中的上混级4包括:去相关器10、2×2上混矩阵4a、以及将单声道/立体声检测器13和语音检测器14的输出转换成某种形式的PS参数的装置,所述某种形式的PS参数可以用作实际立体声上混的输入。

图7示出了当由FM接收器1提供的语音信号由于时变的差的接收状况(例如,“时强时弱(fading)”)而在立体声与单声道之间来回切换时的常见问题。为了在单声道/立体声来回切换期间保持立体声声音图像,可以使用误差掩盖(error concealment)技术。应施加掩盖的时间间隔由图7中的“C”表示。在因为FM接收器1的音频输出下降到单声道而不能计算新的PS参数的情况下,PS编码中的掩盖方法是使用基于先前估计的PS参数的上混参数。例如,在因为FM接收器1的音频输出下降到单声道而不能计算新的PS参数的情况下,上混级4可以继续使用先前估计的PS参数。因此,当FM立体声接收器1切换到单声道音频输出时,立体声上混级4继续使用来自PS参数估计级3的先前估计的PS参数。如果立体声输出中的“信号丢失”时段足够短而使得FM无线电信号的立体声声音图像在信号丢失时段期间保持类似,则在设备2的音频输出中听不到或几乎听不到该信号丢失。另一方法可以是根据先前估计的PS参数对上混参数进行内插和/或外推。关于基于先前估计的PS参数来确定上混参数,根据本文中的教示,还可以使用其他的已知技术来减轻传输误差(例如,数据损坏或的数据丢失)的影响,例如根据可以在音频解码器中使用的误差掩盖机制。

如果FM接收器1在短时段内提供具有噪声的立体声信号,该有噪声的立体声信号太差而不能基于其估计可靠的PS参数,则还可以应用使用基于先前估计的PS参数的上混参数的相同方法。

在下文中,参照图8讨论提供误差补偿的高级PS参数估计级3’。在基于包含有噪声的侧边分量的立体声信号来估计PS参数的情况下,如果使用用于确定PS参数(如用于确定CLD参数(声道电平差)和ICC参数(声道间互相关))的传统公式,则在PS参数的计算中将会出现误差。

被输入到图8所示的内部PS参数估计级3′的实际有噪声的立体声输入信号值lw/noise和rw/noise可以依据如下值来表达:不具有噪声的相应值lw/onoise和rw/o noise及所接收到的侧边信号值的噪声值n:

Iw/noise=m+(s+n)=Iw/o noise+n

rw/noise=m-(s+n)=rw/o noise-n

应当注意的是,此处,所接收到的侧边信号被建模为s+n,其中,“s”是原始(未失真的)侧边信号,“n”是由无线电传输声道所引起的噪声(失真信号)。此外,此处假定信号m不因为来自无线电传输声道的噪声而失真。

因此,相应的输入功率Lw/noise2、Rw/noise2和互相关Lw/noiseRw/noise可以写为:

Lw/noise2=E(lw/noise2)=E((m+s)2)+E(n2)=Lw/o noise2+N2

Rw/noise2=E(rw/noise2)=E((m-s)2)+E(n2)=Rw/o noise2+N2

Lw/noiseRw/noise=E(lw/noise·rw/noise)=E((lw/o noise+n)·(rw/o noise-n))=Lw/o noiseRw/o noise-N2

对于侧边信号噪声功率估计值N2,N2=E(n2),其中“E()”是期望算子。

通过对上述等式重新整理,不具有噪声的相应补偿功率和互相关可以被确定为:

Lw/onoise2=Lw/noise2-N2

Rw/o noise2=Rw/noise2-N2

Lw/o noiseRw/o noise=Lw/noiseRw/noise+N2

可以通过以下给出的公式来执行基于补偿后的功率和互相关的误差补偿的PS参数提取:

CLD=10·log10(Lw/o noise2/Rw/onoise2)

ICC=Lw/o noiseRw/o noise)/(Lw/o noise2+Rw/o noise2)

这样的参数提取对PS参数的计算中的估计值N2项进行补偿。

侧边信号中的噪声的影响如下:当假定侧边信号中的噪声独立于中央信号时:

-与基于无噪声的立体声信号所估计的ICC值相比,该ICC值更接近0,以及

-与基于无噪声的立体声信号所估计的CLD值相比,该分贝形式的CLD值更接近0dB。

为了补偿PS参数中的误差,设备2优选地具有噪声估计级,该噪声估计级被配置成针对由(差的)无线电传输所引起的所接收到的侧边信号的噪声的功率确定噪声参数特性。当估计PS参数时,则可以考虑噪声参数。这可以如图8中所示的来实施。

根据图8,FM信号强度6可以用于至少部分地补偿误差。关于信号强度的信息通常可在FM无线电接收器中获得。信号强度6被输入到PS编码器7中的参数分析级3。在侧边信号噪声功率估计级15中,信号强度6可以被转换成侧边信号噪声功率估计值N2。作为信号强度6的替代或者除了信号强度6之外,可以使用音频信号L、R来估计信号噪声功率,这将在后面讨论。

在图8中,侧边信号噪声功率估计级15被配置成基于信号强度6和/或音频输入信号(L和R)来得出噪声功率估计值N2。噪声功率估计N2可以是随频率和时间变化的。

可以使用各种方法来确定侧边信号噪声功率N2,例如:

-当检测到中央信号的功率最小值(例如语音中的暂停)时,可以假定侧边信号的功率仅是噪声(即,在这些情况下,侧边信号的功率对应于N2)。

-N2估计值可以由信号强度数据6的函数来限定。该函数(或查找表)可以通过实验(物理)测量来指定。

-N2估计值可以由信号强度数据6和/或音频输入信号(L和R)的函数来限定。该函数可以通过启发式规则来设计。

-N2估计值可以基于对中央信号和侧边信号的信号类型相关(coherence)的研究。原始的中央信号和侧边信号例如可以被假定为具有相似的音调噪声比(tonality-to-noise ratio)或波峰因数或其他功率包络特性。这些特性的偏差可以用于表示高等级的N2

在下文中,描述侧边信号噪声功率估计级15和具有误差补偿的PS参数估计级3′的实施例。如已经示出的那样,侧边声道中的(独立的)噪声的附加导致PS参数的估计中的误差。结果如下:

a)CLD值的幅值通常将会减小(至0dB)。因此,再生成的立体声信号趋于更加向中心扩展(pan)。

b)ICC值减小(至0,即朝向去相关)。因此,使用较高程度的人为生成的去相关来用于再生成立体声信号。

尽管对CLD参数的影响相当安全和无害,但是对ICC参数的影响通常被感知为不期望的伪差。在包括附加侧边噪声的单声道语音信号的非常重要和常见的情况下,ICC参数(即左音频信号和右音频信号的互相关)的降低产生上混级中的去相关器的增加的使用,这导致不自然的、宽的、被感知为特殊的干扰的“混响(reverby)”话音。

如此,特定重点应当放在ICC参数的噪声补偿上。图9A中示出了用于生成经噪声补偿的ICC参数的基本概念。ICC参数进入噪声补偿级,其中,输入ICC参数可以对应于如上概述的根据有噪声的左音频信号和右音频信号所确定的ICC参数。

此外,侧边信号进入补偿级。使用侧边信号来估计侧边信号噪声的量。使用噪声估计,对ICC参数进行后处理以补偿噪声并提供新的ICC参数new_ICC,该新的ICC参数new_ICC随后可以用于再生成立体声信号。

图9B更加详细地示出了用于生成噪声补偿后的ICC参数的示例性系统。如本文所概述的那样,在PS参数估计级3中确定ICC参数。PS参数估计级3可以被配置成还确定其他PS参数,例如CLD参数。如果双声道音频信号被表示为左右音频信号,则所述系统可以包括被配置成根据左右音频信号来确定侧边信号的侧边信号确定级22。侧边信号进入影响因子确定级23,影响因子确定级23利用本文所概述的方法基于侧边信号来确定影响因子(impact factor)。特别地,可以基于侧边信号中的噪声的程度来确定影响因子,例如基于侧边信号的谱平坦度。影响因子和在PS参数估计级3中确定的ICC参数被输入至PS参数修改级24,PS参数修改级24被配置成根据本文中所概述的方法来确定噪声补偿后的ICC参数。

侧边信号噪声估计可以基于谱平坦度测量(SFM)。在图10中,描绘了有噪声的语音信号的中央和侧边信号的功率谱。可以看出,中央信号20的功率谱相对陡峭,在较低的频率范围内具有高等级的能量。另一方面,在所示出的单声道语音信号的情况中主要包括噪声的侧边信号21具有整体上较低程度的能量和相对平坦的功率谱。

因为侧边信号噪声21的功率谱相当平坦并且具有特性斜率,可以使用SFM与斜率补偿一起来用于估计噪声水平并随后调节ICC值。可以使用不同类型的SFM值。即可以以各种方式来计算SFM值。特别地,可以使用瞬时SFM值以及平滑版本的SFM。瞬时SFM值通常对应于侧边信号的信号帧的SFM,然而平滑版本的瞬时SFM值还取决于侧边信号的先前信号帧的SFM。

在图11中,描绘了ICC补偿过程30的信号流程。特别地,示出了用于根据侧边信号来确定影响因子的方法30。可以使用影响因子来补偿ICC参数。在步骤31中,确定侧边信号的功率谱。通常,这使用一定数目的侧边信号样本(例如,信号帧的样本)来实现。功率谱的确定周期可以与用于确定PS参数的周期对齐。如此,侧边信号的功率谱可以针对相应的PS参数尤其是ICC参数的有效周期来确定。

在随后的步骤32中,可以对侧边信号噪声的功率谱21的特性斜率进行补偿。可以在实验上(在设计/调谐相位方面)例如通过确定一组单声道信号的侧边信号的平均功率谱来确定特性斜率。可替代地或此外,可以例如使用当前侧边信号的功率谱21的线性回归来根据当前侧边信号自适应地确定特性斜率。可以通过逆噪声斜率滤波器来执行对特性斜率的补偿。作为结果,应当获得斜率补偿后的可能平坦的功率谱,该功率谱不呈现单声道语音音频信号的侧边信号的功率谱的特性斜率。

在步骤33中,使用(斜率补偿后的)功率谱来确定SFM值。可以根据以下来计算SFM:

>SFM=(Πk=0N-1E{Xs2(k)})1/N1NΣk=0N-1E{Xs2(k)}>

其中,表示在混合滤波器组带k中的侧边信号的功率。在示例性PS系统中使用的混合滤波器组包括64个QMF带,其中3个最低带进一步分成4+2+2个带(因此,N=64-3+4+2+2=69)。SFM可以被描述为功率谱的几何平均值与功率谱的算术平均值之比。

可替代地,可以基于频谱的仅包括从Kstart到Kstop的混合滤波器带的子集来计算SFM。这样可以排除例如一个或多个第一带以去除不期望的DC(例如低频)偏移。当相应地调整带边界时,SFM产生:

>SFM=(Πk=KstartKstopE{Xs2(k)})1/(Kstop-Kstart+1)1(Kstop-Kstart+1)Σk=KstartKstopE{Xs2(k)}>

出于限制计算复杂性的原因,可替代地,可以通过基于例如泰勒(Taylor)展开、查找表或软件实施领域中的专家通常所知的类似技术的对SFM公式的数值近似来替换SFM公式。

此外,存在测量谱平坦度的其他明显的现有技术方法,例如标准偏差或频率功率窗口(frequency power bin)的最小值与最大值之差等。在此,使术语“SFM”表示任何这些测量值。

可以使用侧边信号的特定时间段或帧的SFM值确定影响因子。出于该目的,在映射块36中将SFM映射到例如0至1的数值范围。可以根据以下来执行对SFM影响因子的映射和确定:

>SFM_impact_factor=0,SFM<alow_threshSFM-alow_threshahi_thresh-alow_thresh,alow_thresh<SFM<ahigh_thresh1,SFM>ahigh_thresh>

其中,根据SFM值的平均范围(通常在0.2至0.8之间)来选择两个阈值αlow_thresh和αhigh_thresh。归一化级36的主要目的是要确保SFM影响因子规则地跨越“0”与“1”之间的整个区域。如此,归一化确保不会将“标准(normal)”不平坦频谱(SFM<αlow_thresh)检测为噪声,并且确保测量值对于高的值(SFM>αhigh_thresh)饱和。换句话说,归一化提供更加明确地在高噪声情况(SFM>αhigh_thresh)与低噪声情况(SFM<αlow_thresh)之间进行区分的影响因子。

在并行分支中,可以基于平滑版本的SFM值来确定第二SFM影响因子。在步骤34中确定平滑版本的当前SFM值。可以例如递归地执行平滑操作,其中,当前平滑的SFM值是根据先前平滑的SFM值和当前瞬时SFM值的平均值而确定的。为了确定该平均值,先前的平滑的SFM可以由系数α(例如α=0.95)进行加权,当前瞬时SFM值可以由系(1-α)进行加权。如此,可以根据当前瞬时SFM值使用公式SFMsmooth(n)=(1-α)*SFM(n)+α*SFMsmooth(n-1)来递归地确定平滑的SFM值。可以根据α=exp(-1/(τ*采样率/更新率))根据例如时间常量τ=0.62得出系数α,其中,在本示例中,采样率为32kHz,更新率为每1024个样本。

最后,在步骤35中可以以与步骤36的上下文中所概述的类似的方式对当前平滑的SFM值进行映射。然而,用于映射平滑的SFM值以确定第二SFM影响因子的阈值αlow_thresh和αhigh_thresh通常不同于用于不平滑的SFM值的阈值。在示例中,对于平滑的SFM值,所述阈值介于0.5与0.7之间。

平滑的SFM值通常检测稳定的静态噪声,而不平滑的SFM值使用较高的阈值以用于检测短时噪声脉冲。如此,可以使用两者的组合来检测稳定的静态噪声以及短时噪声脉冲。出于该目的,选择两个SFM影响因子之一以用于补偿ICC参数。这在步骤37中执行。在所示示例中,选择所述两个SFM影响因子中的最大值,由此实施具有最高可能降低的去相关的保守方法。可替代地,可以使用两个SFM影响因子(平滑因子和不平滑因子)的加权和来作为所得到的SFM影响因子。

然后,根据以下将所得到的SFM影响因子应用于ICC值:

ICC_new=(SFM_impact_factor)+(1-SFM_impact_factor)*ICC

如上所概述的那样,SFM影响因子被映射到“0”至“1”的范围,其中,“0”对应于表示侧边信号的功率谱的低SFM值,其中谱功率集中在相对小数目的频带中。即,SFM影响因子“0”表示低等级噪声,使得应当保留所估计的ICC参数。另一方面,SFM影响因子“1”对应于表示频谱在所有频谱带中具有类似的功率量的高SFM值。因此,SFM影响因子“1”表示高等级噪声,使得应当强有力地补偿ICC参数。事实上,如果侧边信号仅包括噪声,则ICC参数应当被强制为“1”,即ICC参数应当被强制表示没有去相关,即完全互相关。这通过用于根据原始估计的ICC参数“ICC”和SFM影响因子来确定经噪声补偿的ICC参数“ICC_new”的上述公式来执行。

可以使用其他变换函数来根据原始估计的ICC参数以及根据SFM影响因子来确定经噪声补偿的ICC参数。概括地,可以规定,ICC_new=f(SFM_impact_factor,ICC),其中f()是针对SFM_impact_factor=0为“0”而针对SFM_impact_factor=1为“1”的函数。这些值之间,函数f()是允许将ICC和SFM_impact_factor的可能的值映射到ICC_new的相应值的预定义函数。

图12中的曲线清楚地示出了SFM影响因子的上述功能。在上方曲线图中,绘制了示例性音频信号的侧边信号。该音频信号的第一半部分包含立体声中的经典(歌剧)音乐片段的尾部。第二半部分包含在侧边信号中仅具有噪声的单声道语音。下方曲线图示出了平滑的SFM值41的相应序列和SFM影响因子42的相应序列(在图12中被称为“SFM平滑映射”)。平滑的SFM值41指示侧边信号是否包含噪声。在步骤35中的映射之后,即,在将SFM值域[0.5,0.7]映射到SFM影响因子域[0,1]之后的这种情况下,SFM影响值42采用0至1之间的值并示出了在“低噪声”情况与“高噪声”情况之间的清楚转换。对于0.5以下的SFM值41,SFM影响值42为“0”,而对于0.7以上的SFM值41,SFM影响值42为“1”。如此,SFM影响值42确保在音频信号的第一部分(立体声音乐)期间ICC参数未改变。另一方面,SFM影响值42强制去关闭在音频信号的第二部分(单声道语音)处的去相关。

在声道间互相关参数ICC的上下文中已经概述了对包括在参数化立体声参数内的侧边信号的噪声进行补偿的构思。应当注意的是,存在其他可替代的参数化立体声(PS)参数化法,即除了CLD和ICC之外的其他PS参数组。本文中所概述的噪声补偿的构思也可以应用于这样的可替代的PS参数化法。特别地,噪声补偿可以应用于对在上混级期间施用的去相关的量产生影响以生成输出立体声信号的PS参数。

可以通过下述上混过程来描述可替代的PS参数化法的示例:

S=a*DM+g*decorr(DM),L’=DM+S,R’=DM-S,

其中,DM为缩混信号,“a”和“g”是两个新的PS参数,decorr()是在上混级中使用的去相关器,典型地为全通滤波器。

尽管通常可以根据“CLD”和“ICC”来计算参数“a”和“g”,但是也可以应用SFM受控的参数修改(即本文中所概述的噪声补偿)以减小直接对可替代的PS参数“g”的不期望的去相关,该可替代的PS参数“g”确定上混过程中所附加的去相关的量。在该情况下,图9B的影响因子确定级23中和图9B的PS参数修改级24中的处理将不得不相应地进行适应性修改,而噪声补偿的一般操作原理保持不变。特别地,可以使用不同的映射函数来根据SFM得出SFM_impact_factor,参数修改可以基于下述函数:

g_new=(1-SFM_impact_factor)*g,

即,SFM_impact_factor=1将会强制g_new=0。类似于ICC=1,这意味着在上混级期间未增加去相关。对于SFM_impact_factor=0,g将保持不变。

如此,应当注意的是,本文中所概述的噪声补偿的构思可以应用于各种形式的PS参数化法。特别地,所述构思可以用于调节对被应用于生成输出立体声信号的去相关的量产生影响的一个或更多个PS参数。

此处所讨论的构思可以结合使用PS技术的任何编码器来实施,例如如标准ISO/IEC14496-3(MPEG-4音频)中所定义的HE-AAC v2(高效高级音频编码版本2)编码器、基于MPEG环绕的编码器或基于MPEGUSAC(统一的语音和音频编码器)以及MPEG标准未覆盖的编码器。

在下文中,作为示例,假定了HE-AAC v2编码器;然而,所述构思可以结合使用PS技术的任何音频编码器来使用。

HE-AAC是有损耗的音频压缩方案。HE-AAC v1(HE-AAC版本1)利用频谱带复制(SBR)来提高压缩效率。HE-AAC v2还包括参数化立体声来增强在非常低的比特率处的立体声信号的压缩效率。HE-AAC v2编码器固有地包括PS编码器以允许以非常低的比特率操作。这样的HE-AAC v2编码器的PS编码器可以用作音频处理设备2的PS编码器7。特别地,在HE-AAC v2编码器的PS编码器内的PS参数估计级可以用作音频处理设备2的PS参数估计级3。此外,HE-AAC v2编码器的PS编码器内的缩混级可以用作设备2的缩混级9。

因此,本说明书中所讨论的构思可以与HE-AAC v2编码器有效地结合来实现改进的FM立体声无线电接收器。这样的改进的FM立体声无线电接收器可以具有HE-AAC v2记录特征,因为HE-AAC v2编码器输出可以被存储以用于记录目的的HE-AAC v2比特流。这在图13中示出。在本实施例中,设备2包括HE-AAC v2编码器16和PS解码器8。HE-AACv2编码器提供PS编码器7,如结合前面的附图所讨论的,PS编码器7用于生成单声道缩混DM和PS参数5。

可选地,出于降低FM无线电噪声以支持固定缩混的方案(如根据DM=(L+R)/a的缩混方案)的目的,可以对PS编码器7进行修改。

单声道缩混DM和PS参数8可以被馈送到PS解码器8以生成如上所述的立体声信号L′、R′。单声道缩混DM被馈送到HE-AAC v1编码器以用于对单声道缩混DM进行感知编码。所得到的经感知编码的音频信号和PS信息被复用到HE-AAC v2比特流18中。出于记录的目的,HE-AAC v2比特流18可以存储在存储器如闪存或硬盘中。

HE-AAC v1编码器17包括SBR编码器和AAC编码器(未示出)。SBR编码器通常执行在QMF(正交镜像滤波器组)域中的信号处理并因此需要QMF样本。相反地,AAC编码器通常需要时域样本(通常被因子2下采样)。

在HE-AAC v2编码器16内的PS编码器7通常提供已经在QMF域中的缩混信号DM。

因为PS编码器7可能已经将QMF域信号DM发送到HE-AAC v1编码器,所以在HE-AAC v1编码器中的用于SBR分析的QMF分析变换可能过时。因此,可以通过提供如QMF样本的缩混信号DM来避免作为HE-AAC v1编码器的正常部分的QMF分析。这减少了计算工作并使得降低复杂性。

AAC编码器的时域样本可以例如通过在时域中执行简单运算DM=(L+R)/2以及通过对时域信号DM进行下采样而从设备2的输入得出。该方法很可能是最廉价的方法。可替代地,设备2可以执行对QMF域DM样本的半速率QMF合成。

在本文中,已经描述了用于降低FM无线电接收器的噪声的方法和系统。根据接收到的中央信号和侧边信号来确定PS参数,以使用中央信号和PS参数来生成噪声减小的音频信号。为了降低噪声对所估计的PS参数的影响,已经描述了噪声估计和补偿方法。

本文所描述的方法和系统可以被实施为软件、固件和/或硬件。某些部件可以例如被实施为在数字信号处理器或微处理器上运行的软件。其他部件可以例如被实施为硬件和/或被实施为专用集成电路。在所描述的方法和系统中遇到的信号可以被存储在介质如随机存取存储器或光学存储介质上。它们可以经由网络如无线电网络、卫星网络、无线网络或有线网络(例如因特网)来传输。利用本文中所描述的方法和系统的典型设备为便携式电子设备或用于存储和/或演奏音频信号的其他消费电子设备。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号