首页> 中国专利> 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法和计算机程序

使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法和计算机程序

摘要

使用窄带输入信号生成宽带信号的装置、方法和计算机程序,其包含使用传递参数执行制导带宽扩展操作和仅使用传递参数之外的导出参数执行盲带宽扩展操作的处理器(23)。为此,该处理器包含用于产生盲带宽扩展操作参数的参数发生器(24)。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-06-17

    授权

    授权

  • 2013-03-27

    实质审查的生效 IPC(主分类):G10L21/038 申请日:20110414

    实质审查的生效

  • 2013-02-27

    公开

    公开

说明书

技术领域

本发明涉及音频处理,特别涉及针对组合的盲带宽和制导带宽扩展的装置、方法和计算 机程序。

背景技术

音频信号的储存或传输往往受制于比特率的苛刻约束。过去,在只有极小比特率可用时, 编码器被迫大大减小传输的音频带宽。如今,现代音频解码器可以使用带宽扩展(BWE)方法 编码宽带信号。这些算法依赖于高频(HF)内容-的参数表示,高频内容是通过变换到HF频谱 范围(“修补”)并应用一个参数驱动的后处理从解码信号的波形编码低频(LF)部分产生的。

后处理包括以原始信号能量分布为目标的能级调整(也称频谱整形),还包括借助波带选 择性反向滤波(减小音调)的在HF带变换中的感知音调的调整、增加合成背景噪声(减小音调) 或增加个别正弦曲线(增大音调)。

BWE利用LF与HF之间的关系,目的在于生成与原始HF内容尽可能相似的HF信息。这 种BWE把该频率扩展到某最高频率Fmax。因此最高频率的确定取决于质量与比特率的折中。

美国专利号6,680,972B1披露了使用频段复制的信源编码增强方法。在编码器内或之前 减小带宽,接着在解码器上完成频段复制。这是通过使用变换方法并结合频谱调整实现的。 得到指定感知质量下的减小比特率,或指定比特率下提高的感知质量。

相关技术包含在MPEG-4标准(ISO/IEC14496-3:2005(E))中。特别是,该标准4.6.18小 节包含频段复制(SBR)工具。此工具扩展带宽有限的解码音频信号的音频带宽。此过程以复 制原先截短的谐波序列为基础,该原先截短是为了减少来自有效带宽有限信号的数据率并控 制从编码器得到的数据。音色分量与类噪声分量之间的比率由自适应反向滤波以及增加噪声 和正弦波维持。来自编码器的控制数据包含调节修补信号频谱的频谱调节数据,另外,设置 音色分量与类噪声分量之间比率用的反向滤波数据要加到该修补信号上,有关遗漏谐波的信 息要在生成宽带信号的SBR操作中加到该修补信号上。

这一标准化的程序仅执行制导带宽扩展,因为宽带信号要产生的最高频率也用属于低波 段高分辨率信号的参数反映。这样,为了通过产生带宽更高的信号来提高音频信号的质量, 还需要能额外增强传输数据的比特率的其他参数。另一方面,当出于传输信道容量的考虑而 需要减小比特率时,可能会削减针对编码器上复制信号的最高或部分最高频段的参数。这会 自动造成音频质量的下降,因为SBR解码器只能生成某频率(即某频段以下)以下的高频部分, 该频段的参数包含在输入数据或位流中。因此,减小比特率将导致音频质量下降,换句话说, 提高音频质量将导致比特率增大。

发明内容

本发明的宗旨是提出改进的、兼顾高品质和低比特率的带宽扩展概念。

这个目标是通过根据权利要求1的生成宽带信号的装置、根据权利要求14的生成宽带 信号的方法或根据权利要求15的计算机程序实现的。

本发明的依据是,为了提高音频质量和/或减小比特率,将制导带宽扩展操作与盲导带 宽扩展操作结合。盲带宽扩展操作是不传递其任何参数的带宽扩展操作。换句话说,盲带宽 扩展操作将产生属于高于最大频率的信号频谱分量,其带宽扩展参数已经在位流中传递了。 使用窄带输入信号和一组已经传递的参数生成扩展到第一频率以下的第一个频率分量以及 执行制导带宽扩展操作的处理器也适合执行盲带宽扩展操作,这种操作使用低频带信号或第 一个频率分量和第二组参数生成扩展到高于第一频率的第二频率以下的第二个频率分量。第 二个参数不从带宽扩展解码器中传递,但由根据第一组参数生成第二组参数或仅根据带宽扩 展解码器侧的第一个频率分量生成第二组参数的参数发生器产生。换句话说,盲带宽扩展操 作的操作方式可能与制导带宽扩展操作的方式相似。但不同的是,带宽扩展操作使用的任何 参数都是在解码器侧产生的并从编码器传递至解码器。而对于盲带宽扩展操作来说,任何参 数都不在编码器侧产生,也不从编码器向解码器传递任何参数,但仅在解码器侧使用解码器 上可以获得的信息产生,而不使用关于原始信号对应频率分量的任何信息。在解码器侧并非 可以获得有关对应于盲带宽扩展操作生成的频率分量的原始音频信号的所有信息,因为针对 第一个频率分量的窄带信号和已传递的参数都不包含有关第二个频率分量的任何信息。该信 息仅在解码器侧上产生,未使用任何传递参数,也就是所谓的“盲”方式。

现有发明的一个优势是它通过制导带宽扩展(gBWE)与盲带宽扩展(bBWE)的结合进一步 提高了带宽扩展信号的感知质量。现有发明依赖于利用高频分量与甚高频分量之间的关系, 其中高频分量对应于上述现代带宽扩展方法中使用的传递参数所涵盖的频率带宽。

本发明的主题是通过组合制导BWE(gBWE)与盲BWE(bBWE)进一步提高BWE信号的感知质 量。这是通过利用高频分量与甚高频分量的关系实现的。

现代带宽扩展方法,如频带复制(SBR)或谐波带宽扩展(HBE)首先要完成修补操作,以便 生成HF分量。这种修补操作可以是任何类型的非线性处理,如剪切、取绝对值或相位声码器 (phase vocoder);该操作还可以结合单边带调制,或插值。然后利用其他参数将生成的补 丁改成原始HF分量。

除了gBWE之外,还有仅仅以扩展音频信号带宽为目标的bBWE方法。它可以通过插入HF 噪声、剪切等实现,但没有任何侧面信息。

运用现代BWE方法可产生频带有限的信号,没有充分利用信号HF分量中的冗余。因此, 没有达到最大可能的带宽。硬低通滤波信号还可以理解成具有低通滤波器截止频率音高的音 调,特别是,如果该信号类似噪声的话。此外,这种低通滤波器还会产生短暂失真。

本发明陈述了上述不足,其中盲带宽扩展操作应用在甚高频分量上,即扩展到高于第一 频率的第二频率的第二频率分量。然而,为了保持传输速率较低,该第二频率分量的任何参 数都没有从编码器传递至解码器,因此,该装置没有收到用于生成宽带信号的任何参数。

因此,提出的概念避免了与信号截止频率上滤波器坡度较陡有关的音调。此外,还减轻 了与这些滤波器特性有关的短暂失真。此外,本发明还拓宽了信号的感知带宽而不需要或者 只需要少量侧面信息。它可以作为任何底层带宽扩展方法之上的后处理器使用。

因此,这个独创概念适合使用参数驱动带宽扩展方法的所有音频应用,或也可用于通过 解码器侧带宽扩展操作提高音频质量的任何音频或相位声码器。

附图说明

下面结合附带的图纸讨论本发明的优选实施例,其中:

图1a到1c表示制导和盲带宽扩展概念的不同应用;

图2a表示根据窄带信号生成的宽带信号的频率分量,其中使用制导带宽扩展生成第一频 率分量,使用盲带宽扩展操作生成第二频率分量;

图2b表示宽带信号生成装置的一个优选实施例;

图3表示宽带信号生成装置或方法的另一个优选实施例;和

图4表示实现发明概念的一个优选实施例的流程图。

具体实施方式

图2b表示使用窄带输入信号20和第一组参数21生成宽带信号的装置。第一组参数描 述了高于窄带输入信号最大频率而最高至第一频率的频率分量。描述第一频率以上频率分量 的参数不包含在第一组参数21中。该数据输入到输入接口22中,它从参数21中分离出窄 带信号20。该数据转发到处理器23,以便使用窄带输入信号20和第一组参数21执行制导 带宽扩展操作(BWE),生成扩展到第一频率以下的第一频率分量。此外,处理器23配置成执 行盲带宽扩展操作,从而使用窄带输入信号或第一频率分量和/或第二组参数生成扩展到第 二频率(高于第一频率)以下的第二频率分量。为了生成第二组参数,该处理器包含用于根据 第一组参数21或仅根据第一频率分量生成第二组参数的参数发生器24,当第二组参数仅根 据第一频率分量生成时,第一组参数21不引入到该参数发生器。不过,当参数发生器24使 用第一组参数21生成第二组参数时,情况如图2b所示,即输入接口22具有一个到参数发 生器24的连接。

图2a表示频率图,以便说明频率情况。窄带输入信号只有窄带带宽25a。窄带带宽25a 从最小频率(如20Hz左右)扩展,直到窄带最大频率25b,比如4kHz。传递参数涵盖的且由 制导带宽扩展概念生成的第一频率分量25c扩展到第一频率25d。第一频率25d可以,比如 是12kHz。第二频率分量25e扩展到第二频率25f,而对于在第一频率25d与第二频率25f 之间扩展的第二频率分量25e,在编码器侧没有传递或生成任何参数。打个比方说,第二频 率可以是16kHz。

如图2a所示,为生成第一频率分量而执行制导带宽扩展操作,为生成频率比第一频率 分量更高的第二频率分量而执行盲带宽扩展操作。第一和第二频率分量可以不重叠。

第一频率分量25c与第二频率分量25d一起随窄带输入信号20传递给图2b中生成宽带 信号的组合器26。根据具体应用,该组合器可以是综合滤波器组,也可以是时间域组合器。 组合器26的具体实现与处理器23的实现有关,即窄带信号、第一频率分量和第二频率分量 是否可作为具有对应频率分量的时间域信号使用,是否可作为子带信号或变换信号(即频率 表示中可用的信号)使用。

图1a表示运用制导带宽扩展操作和盲带宽扩展操作实现处理器23的第一实现。窄带信 号21输入修补器10,以便在修补器10的输出上产生修补信号。修补操作基本上使用低频部 分并在较高频率的部分中产生一个信号。优选地修补操作包含,对于制导带宽扩展,把滤波 器组信源波段中的相邻子带修补成该滤波器组目标波段中的相邻子带、以谐波 (harmonically)修补信源波段中的子带到目标波段、剪切、取绝对值或使用相位声码器 (phase vocoder)、单边带调制或插值。针对盲带宽扩展的修补操作包含在第二频率分量 中插入噪声或剪切包含第一频率分量或窄带的信号,从而生成更高的频谱分量。

修补信号输入整形器11,在整形器11的输出上得到整形的修补信号。然后,在组合器 12中,窄带信号21和整形器11输出的整形修补信号组合在一起,在组合器的输出上得到宽 带信号13。

图1b表示一个不同的实现,其中颠倒了修补器10和整形器11的顺序。整形器11为对 窄带信号21整形而配置,使用第一组参数处理制导带宽扩展,使用第二组参数和/或有关第 一频率分量的信息生成整形的窄带信号。整形器11的输出上的这个整形窄带信号具有与原 始窄带信号相同的频率分量,但现在用修补器10修补成包含第一频率分量25a和第二频率 分量25e的高频波段(如图2a所示)。接着,修补器的输出上的修补信号在组合器12中与窄 带信号21结合,因为在修补前执行了整形操作,所述信号已经整形。

因此,图1b与图1a的差别在于整形器11和修补器10的顺序被颠倒了。

在另一个备选实现中,如图1a所示,修补器直接应用在窄带信号上。接着窄带信号21 和已修补但尚未整形的信号结合,从而在功能块12的输出上得到一个组合信号。该组合信 号具有图2a中的25a、25c、25e频率分量,但第一频率分量25c和第二频率分量25e尚未 整形。然后通过连接在组合器12上的整形器11完成该组合信号高频分量的整形。

在图1a、图1b和图1c中的所有实现中,整形器使用第一组参数执行制导带宽扩展,使 用第二组参数执行盲带宽扩展,其中第二组参数是通过参数发生器24,根据第一组参数和/ 或第一频率分量得出的,图2b中示出了该发生器,但图1a、图1b和图1c中没有表示。

图3表示本发明的另一个优选实施例。从编码器(图3中未表示)接收位流20。该位流被 划分成图3中在“宽带侧信息”(sideinfo)上表示的低波段或低通(LP)输入信号20和第一 组参数21。该低通输入信号20转发到带宽扩展I模块30,以便执行图1a、图1b或图1c中 用修补器表示的修补。接着,由带宽扩展模块30产生的、用于实现制导带宽扩展操作的修 补信号转发到频谱整形器11a,以便使用包含在该位流中的宽带侧信息21执行频谱整形。频 谱整形模块11a的输出接着转发到音调校正模块21,从而得到制导带宽扩展的输出信号。包 含第一频率分量25c的这个输出信号一方面转发到组合器12和盲带宽扩展II模块32。带宽 扩展II模块32在该优选实施例中使用第一频率分量25c执行修补,尽管带宽扩展II模块 32也可以使用窄带信号。然而,鉴于第一频率分量与第二频率分量之间的关系更理想,优选 地在模块32中使用第一频率分量25c执行盲带宽扩展。然后,在模块11b中使用第二频率 分量25e执行频谱整形,其中执行该频谱整形用的信息由参数发生器或sideinfo外推模块 24转发,后者根据第一组参数计算第二组参数。然后,经频谱整形的第二频率分量25e与第 一频率分量25c和组合器12中的窄带信号20结合,从而得到宽带信号13。

在本发明的优选实施例中,盲带宽扩展操作在制导带宽扩展操作的上方应用。在图3中, 它使用模块11a和31中传递的第一组参数和没有通过模块库从编码器传递到解码器的第二 组参数表示。制导带宽扩展操作的输出用于进一步扩展该信号的带宽,而不需要用转发第一 频率分量25c到图3中模块32表示的任何附加侧面信息。由于音调和频谱形状已经针对该 信号作了调整,且可以假设高频分量没有对甚高频而明显改变,在模块31上得到的经过处 理的扩展信号被修补,以便进一步扩展它。优选为对盲带宽扩展部分使用上频率分量,即第 一频率分量,但也可以使用该频谱的任意部分。

对于盲带宽扩展,正如参数发生器或sideinfo外推模块24所表示的那样,可以外推用 于制导带宽扩展的侧面信息。盲带宽扩展部分的频谱整形,即按盲带宽扩展部分的频段的能 量或功率参数的应用,对应于模块库中的频谱整形。为此,对于第二频率分量25e的频带, 不得不计算能量参数,即成为衡量指标、与频带中能量有关的参数。这可以通过定义针对制 导带宽扩展信号最高1-4kHz的能量对数的回归线来实现。该回归线在图2a中的29上给出。 优选地该外推线的导数小于1。

另一种备选实现可以是测量图2a中在14上表示的第一频率分量最高频段的能量,然后 第二频率分量25e的后续频段41、42、43和44的能量减小任意值,比如1.5或3dB。

于是,第二组参数至少包含针对第二频率分量41到44频段的能量值。这些能量值可以 使用包含在第一组参数中的能量计算,但(如图2a所示)也可以不用第一组参数计算。因此, 参数发生器24只能选择接收第一组参数并接收第一频率分量,从而确定回归线或确定第一 频率分量最高频段40的能量。不过,当仅根据第一组参数计算频段41到44的能量值时, 那么计算第二组参数时不需要第一频率分量。在其他实施例中,第二频率分量的能量值也可 以使用第一频率分量和包含在第一组参数中的能量值组合计算。

对于盲带宽扩展,其他参数,如背景噪声和反向滤波,既可以外推,也可以忽略。如果 在盲带宽扩展中没有考虑它们,用于制导带宽扩展的参数,即传递参数21,也可以用于控制 由盲带宽扩展(BWEII)处理的频谱部分,如图3中的32所示。或者,可以省略不同于使用能 量参数进行频谱整形的任何其他整形操作。

图4用流程图的形式表示该发明的概念的一个优选实现。在步骤50中,从传递信号(位 流)中提取窄带信号和第一组参数,所述步骤50通过图2b中输入接口22实现。然后在步骤 51中使用窄带信号20修补窄带信号,以便得到带宽扩展到第一频率以下的第一修补信号。 然后,在步骤52中,使用第一组参数整形由步骤51产生的第一修补信号,以便得到第一整 形信号,其对应于如图3中25c所示的由音调校正模块31输出的信号。步骤53表示使用第 一组参数和/或第一整形信号计算第二组参数。步骤54表示修补第一整形信号,以便得到扩 展到第二频率25f以下的第二修补信号,如图2a所示。如步骤55所示,然后对第二修补信 号进行整形,从而得到第二整形信号,然后在步骤56中,窄带第一整形信号和第二整形信 号结合,最终得到宽带信号13。

正如前面所讨论的那样,第二组参数可以用不同方式从第一组参数和/或第一频率分量 中得到,其中对于有些实现来说,仅使用第一频率分量而不使用第一组参数,对于其他应用 来说,仅使用第一组参数而不使用第一频率分量,而对再其他的实现来说,则使用第一组参 数与第一频率分量的组合。此外,需要指出的是,对于除频谱(envelope)调整能量参数之 外的参数,那些参数根本不能在盲带宽扩展操作中使用,或者可以根据第一组参数外推,其 中一种非常直截了当的外推方法使用第二频率分量25e中由编码器为第一频率分量25c生成 的相同参数。比如当考虑到第一频率分量由二十个频段组成时,且当第二频率分量由三十个 频段组成时,那么针对第二频率分量前二十个频段的参数与第一频率分量的前二十个频段的 参数相同,而针对第二频率分量最后十个频段剩下的十个参数将通过外推得出,或者根本不 会在最后十个频段中应用音调校正。

虽然有些方面已经在一装置的上下文中描述过,显然这些方面也表示对应方法的描述, 其中一个模块或设备相当于一方法步骤或方法步骤的一特征。类似地,方法步骤上下文中描 述的方面也表示对应模块或对应装置的项或特征的描述。

本发明的传递信号可以保存在数字存储介质中,也可以在传输介质上传递,如无线传输 介质或有线传输介质,比如互联网。

根据某些实现要求,本发明的实施例可以用软件或硬件实现。实现可以使用数字存储介 质执行,如软盘、DVD、CD光盘、ROM、PROM、EPROM、EEPROM或闪存,这些介质上可存储电 子可读控制信号,其配合(或能够配合)可编程计算机系统执行相关方法。

部分符合本发明的实施例包含具有电子可读控制信号的非瞬时数据载体,能配合可编程 计算机系统执行本文所描述的方法之一。

一般来说,本发明的实施例可以用程序代码实现成计算机程序产品,当该计算机程序产 品在计算机上运行时程序代码可执行所述方法之一。程序代码,例如,可以存储在机器可读 的载体上。

其他实施例包含用于执行本文描述的方法之一、存储在机器可读载体上的计算机程序。

换句话说,因此,所述发明的方法的一个实施例是具有程序代码的计算机程序,当该计 算机在计算机上运行时,程序代码可执行本文描述的方法之一。

因此,本发明的方法的另一个实施例是数据载体(或数字存储介质,或计算机可读介质), 它包含其中记录的、用于执行本文描述的方法之一的计算机程序。

因此,本发明的方法的另一个实施例是代表计算机程序的数据流或信号序列,该程序用 于执行本文描述的方法之一。数据流或信号序列,例如,可以配置成通过数据通讯连接传输, 比如通过互联网。

另一个实施例包含处理装置,比如配置成或适合执行本文描述的方法之一的计算机或可 编程逻辑设备。

另一个实施例包含处理安装了用于执行本文描述的方法之一的计算机程序的计算机。

有些实施例中,可使用可编程逻辑设备(如现场可编程门阵列)执行本文描述的方法的部 分或全部功能。有些实施例中,现场可编程门阵列可配合微处理器执行本文描述的方法之一。 一般来说,所述方法优选地由任何硬件装置执行。

以上描述的实施例仅仅是为了便于解释本发明的原理。可以理解的是,对于本领域技术 人员来说,显然可以对本文所描述的机构和细节作出修改。因此,本文的意图仅仅在于限制 待定专利的权利要求范围,而不是为了限制其中通过实施例的描述和解释方式所呈现的具体 细节。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号