首页> 中国专利> 利用频域维纳滤波对空间音频编码进行时间包络整形

利用频域维纳滤波对空间音频编码进行时间包络整形

摘要

本发明涉及利用频域维纳滤波对空间音频编码进行时间包络整形。特定类型的参数空间编码编码器采用声道间幅值差、声道间时间差以及声道间相干或相关性来建立多声道声场的参数模型,解码器采用该参数模型来构造对原始声场的近似。然而,所述参数模型没有构造声场声道的原始时间包络,而声场声道的原始时间包络被发现对于一些音频信号极为重要。本发明在空间编码系统中对一个或更多个解码声道的时间包络进行整形以更好地与一个或更多个原始时间包络相匹配。

著录项

  • 公开/公告号CN102968996A

    专利类型发明专利

  • 公开/公告日2013-03-13

    原文格式PDF

  • 申请/专利权人 杜比实验室特许公司;

    申请/专利号CN201210467810.9

  • 发明设计人 马克·S·温顿;阿兰·J·泽费尔特;

    申请日2005-08-15

  • 分类号

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人杜娟

  • 地址 美国加利福尼亚

  • 入库时间 2024-02-19 17:37:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-06-10

    授权

    授权

  • 2013-04-10

    实质审查的生效 IPC(主分类):G10L19/008 申请日:20050815

    实质审查的生效

  • 2013-03-13

    公开

    公开

说明书

本申请是申请号为201110236398.5、申请日为2005年8月15日、发明名称为“利用频域维纳滤波对空间音频编码进行时间包络整形”的发明专利申请的分案申请。 

技术领域

本发明涉及基于块的音频编码器,其中音频信息在被解码时具有由块率限定的时间包络分辨率,该编码器包括感知的且参数化的音频编码器、解码器及系统,本发明还涉及对应的方法,用于实现这种方法的计算机程序,以及由这种编码器生成的位流。 

背景技术

很多降低比特率的音频编码技术都是“基于块”的,其中,编码包括如下处理:对解码成多个时间块的一个或更多个音频信号中的每一个进行划分,并且以不高于块率的频率对与解码音频相关联的一些附带信息(side information)进行更新。因此,音频信息在被解码时具有由块率限定的时间包络分辨率。因此,基于时间的解码音频信号的具体结构被保留的时间段不小于编码技术的粒度(granularity)(通常在每块8到50毫秒的范围内)。 

这种基于块的音频编码技术不仅包括已经建立的感知编码技术,已知有AC-3、AAC以及各种MPEG,在该技术中通常通过编码/解码处理保留离散的声道,而且包括最近引入的比特率受限编码技术,有时将其称为“心理声学编码(Binaural Cue Coding)”以及“参数立体声编码”,在该技术中通过编码/解码处理将多个输入声道缩混为单个声道,并且从单个声道上混为多个声道。这种编码系统的详情包含在 不同文档中,包括下面在标题“引用并入”下所引用的那些文档。由于在这种编码系统中使用了单个声道,所以重构的输出信号必须是彼此幅度成比例的——对于特定块,不同输出信号必须具有基本上相同的精细包络结构。 

虽然所有基于块的音频编码技术都可因为其解码音频信号的时间包络分辨率的提高而得益,但是在整个编码/解码处理中不保留离散声道的、基于块的编码技术中,对这种提高的需要尤为强烈。对于这种系统来说,特定类型的输入信号(例如,欢呼)尤其存在问题,该输入信号使得再现的感觉到的空间图像变窄或塌缩。 

附图说明

图1是实施本发明方面的编码器或编码功能的示意性功能框图。 

图2是实施本发明方面的解码器或解码功能的示意性功能框图。 

发明内容

根据本发明第一方面,提供了一种用于音频信号编码的方法,其中,将一个或更多个音频信号编码为位流,该位流包括音频信息和与该音频信息相关联且在对该位流进行解码时有用的附带信息,所述编码包括以下处理:将所述一个或更多个音频信号中的每一个划分为多个时间块;并且以不高于块率的频率对至少一些所述附带信息进行更新,使得所述音频信息在被解码时具有由所述块率限定的时间包络分辨率。将至少一个音频信号的时间包络与经估计解码重构的每一个所述至少一个音频信号的时间包络进行比较,该经估计的重构采用至少一些所述音频信息和至少一些所述附带信息,比较结果的表示有助于提高至少一些所述音频信息在被解码时的时间包络分辨率。。 

根据本发明另一方面,提供了一种音频信号编码及解码的方法,其中,将一个或更多个输入音频信号编码为位流,该位流包括音频信息和与该音频信息相关联且在对该位流进行解码时有用的附带信息,接收所述位流并利用所述附带信息对所述音频信息进行解码来提供一 个或更多个输出音频信号,所述编码和解码包括如下处理:将所述一个或更多个输入音频信号中的每一个和经解码的位流分别划分为多个时间块,所述编码以不高于块率的频率对至少一些所述附带信息进行更新,使得所述音频信息在被解码时具有其分辨率被所述块率限定的时间包络。在至少一个输入音频信号的时间包络与经估计解码重构的每一个所述至少一个输入音频信号的时间包络之间进行比较,该经估计的重构采用至少一些所述音频信息和至少一些所述附带信息,所述比较提供了比较结果的表示,所述表示有助于提高至少一些所述音频信息在被解码时的时间包络分辨率。进行对至少一些所述表示的输出,并且进行对所述位流的解码,所述解码采用所述音频信息、所述附带信息以及所述输出的表示。 

根据本发明又一方面,提供了一种音频信号解码的方法,其中,将一个或更多个输入音频信号编码为位流,该位流包括音频信息和与该音频信息相关联且在对该位流进行解码时有用的附带信息,所述编码包括如下处理:将所述一个或更多个输入音频信号中的每一个分为多个时间块,并且以不高于块率的频率对至少一些所述附带信息进行更新,使得所述音频信息在采用所述附带信息对其解码时具有由所述块率限定的时间包络分辨率,所述编码进一步包括在至少一个输入音频信号的时间包络与经估计解码重构的每一个所述至少一个输入音频信号的时间包络之间进行比较,该经估计的重构采用至少一些所述音频信息和至少一些所述附带信息,所述比较提供了比较结果的表示,所述表示有助于提高至少一些所述音频信息在被解码时的时间包络分辨率,并且所述编码进一步包括输出至少一些所述表示。进行对所述位流的接收和解码,所述解码采用所述音频信息、所述附带信息以及所述输出的表示。 

本发明的其他方面包括适于执行上述方法的设备、存储在计算机可读介质上以用于使计算机执行上述方法的计算机程序、由上述方法生成的位流、以及由适于进行上述方法的设备生成的位流。 

具体实施方式

图1示出了可以采用本发明方面的编码器或编码处理环境的示例。将诸如PCM信号的多个音频输入信号、各个模拟音频信号的时间采样(1到n)应用到相应的时域到频域转换器或者转换功能块(“T/F”)2-1至2-n。音频信号例如可表示诸如左、中、右等的空间方向。例如可通过如下操作来实现各T/F:将输入音频采样划分为多个块、对这些块进行加窗(windowing)、使这些块交叠、通过计算离散频率变换(DFT)来将经加窗和交叠的块中的每一块变换到频域、并且采用例如等效矩形频带(ERB)尺度(scale)将所得频谱划分为模拟人耳临界频带的多个频带,例如二十一个频带。这种DFT处理在本领域中是广为公知的。可采用其他的时域到频域转换参数和技术。具体参数或是具体技术对于本发明来说并非关键。然而,出于易于解释的目的,下面的描述假设采用这种DFT转换技术。 

T/F 2-1至2-n的多个频域输出中的每一个是一组谱系数。这些组可分别表示为Y[k]1至Y[k]n。可将所有这些组应用于基于块的编码器或编码器功能块(“基于块的编码器”)4。基于块的编码器例如可以是上述的已知基于块的编码器中的单独任一种或有时是它们的组合,或者是包括上述这些编码器的变型的任何未来的基于块的编码器。尽管本发明的方面尤其适于与在编码和解码期间不保留离散声道的基于块的编码器结合来使用,但是本发明的方面事实上与任何基于块的编码器结合都是有用的。 

典型的基于块的编码器4的输出的特征为“音频信息”和“附带信息”。音频信息例如可包括表示多个信号声道的数据(如可能在基于块的编码系统(例如,AC-3、AAC及其他)中存在的),或者该音频信息可仅包括通过缩混多个输入声道而获得的单个声道,例如上述心理声学编码系统及参数立体声编码系统(还可利用例如AAC或某一其他适合编码对心理声学编码编码器或参数立体声编码系统中的缩混声道进行感知编码)。该音频信息还可以包括通过缩混多个输入声道而获得的单个声道或多个声道,例如在Davis等人于2004年7月14 日提交的题为“Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information”的美国临时专利申请S.N.60/588256中所公开的。在此通过引用并入所述S.N.60/588256的全部内容。附带信息可包括与音频信息相关且在对其进行解码时有用的数据。在各种缩混编码系统的情况下,附带信息例如可包括如下空间参数,诸如声道间幅值差、声道间时间差或相位差以及声道间互相关性。 

然后可将来自基于块的编码器4的音频信息和附带信息应用于相应的频域到时域转换器或转换功能块(“F/T”)6,所述频域到时域转换器或转换功能块(“F/T”)6中的每一个通常执行上述T/F的相反功能,即逆FFT,接着进行加窗和交叠相加。将来自F/T 6的时域信息应用于提供经编码的位流输出的位流打包器或打包功能块(“位流打包器”)10。另选的是,如果编码器要提供表示频域信息的位流,则可省略F/T 6。 

还将来自基于块的编码器4的频域音频信息和附带信息应用于解码估计器或估计功能块(“解码估计器”)14。解码估计器14可模拟被设计用来对位流打包器10提供的编码位流进行解码的解码器或解码功能块的至少一部分。下面结合图2来描述这种解码器或解码功能块的示例。解码估计器14可提供多组谱系数X[k]1到X[k]n,多组谱系数X[k]1到X[k]n近似于对应输入音频信号的多组谱系数Y[k]1到Y[k]n(期望要在解码器或解码功能块处获得)。另选的是,可以为少于所有输入音频信号、为少于输入音频信号的所有时间块、以及/或者为少于所有频带,提供这种谱系数(即,它可能不提供所有谱系数)。这例如可能起因于希望仅改进表示被认为比其他声道更重要的声道的输入信号。作为另一示例,这可能起因于希望仅改进信号中的、人耳对其时间波形包络的精细细节更为敏感的较低频部分。 

将T/F 2-1至2-n的频域输出、即多组谱系数Y[k]1到Y[k]n中的每一个也分别应用于相应的比较设备或功能块(“比较”)12-1至12-n。在相应的比较12-1至12-n中将这些组与对应多组对应时间块的估计 谱系数X[k]1到X[k]n的进行比较。将各比较12-1至12-n中的比较结果分别应用于滤波器计算器或计算功能块(“滤波器计算”)15-1至15-n。该信息应当足以进行各滤波器计算以限定各时间块的滤波器系数,所述滤波器在应用于输入信号的解码重构之后应得到具有提高的分辨率的时域包络的信号。换言之,该滤波器将对信号进行整形以使得它更为接近地复制原始信号的时间包络。提高的分辨率是比块率更精细的分辨率。下面将进一步具体阐述优选滤波器。 

尽管图1中的示例示出了在频域上的比较和滤波器计算,但是原理上也可在时域上进行比较和滤波器计算。无论在频域还是在时域上进行,每时间块仅确定一个滤波器结构(尽管可将相同的滤波器结构应用于某一数量的连续时间块)。尽管原理上可逐带地(例如,每ERB尺度的频带地)确定滤波器结构,但是执行该操作将需要发送大量附带信息位,这将消除本发明的优势,即,以较低的比特率增长来提高时域包络分辨率。 

将各比较12-1至12-n中的比较测定值分别应用于判定设备或功能块(“判定”)16-1至16-n。各判定将比较测定值与阈值相比较。比较测定值可采取各种形式且并非关键。例如,可计算各对应系数值之差的绝对值并对这些差求和,来提供单个数目,其值表示在一时间块期间信号波形彼此不同的程度。可将该数目与阈值进行比较,使得如果该数目超过了阈值,则向对应的滤波器计算提供“是”指示。在没有“是”指示的情况下,可能禁止对于该块的滤波器计算,或者如果计算的话,则它们可能不通过滤波器计算输出。各信号的这种是/否信息构成了可能还应用于位流打包器10以包括在位流中的标志(因此,可能有多个标志,每个输入信号一个,并且这些标志中的每一个可由一位来表示)。 

另选的是,代替来自对应比较12-1至12-n的信息,或者除了来自对应比较12-1至12-n的信息之外,各判定16-1至16-n还可能接收来自对应滤波器计算14-1至14-n的信息。相应的判定16可采用计算出的滤波器特性(如,其平均值或其峰值幅值)作为进行判定的基础 或辅助进行判定。 

如上所述,各滤波器计算14-1至14-n提供了比较结果的表示,这可能构成滤波器系数,所述滤波器在应用于经解码重构的输入信号时将得到具有分辨率提高的时间包络的信号。如果谱估计谱系数X[k]1到X[k]n是不完全的(在解码估计器针对少于所有输入音频信号、针对少于输入音频信号的所有时间块、并且/或者针对少于所有频带,提供谱系数的情况下),则可能对于所有时间块、频带和输入信号,不存在各比较12-1至12-n的输出。读者应当注意,X[k]1到X[k]n是指经重构的输出,而Y[k]1到Y[k]n是指输入。 

可将各滤波器计算14-1至14-n的输出应用于位流集合器10。尽管可将滤波器信息与位流分开发送,但是优选地将其作为位流的一部分并作为附带信息的一部分来发送。当将本发明的方面应用于现有的基于块的编码系统时,可将由本发明的方面提供的附加信息插入到这些系统的位流的、旨在载带附加信息的部分中。 

在实际实施例中,可以按照某种方式,不仅对音频信息而且或许对附带信息和滤波器系数进行量化或编码来是它们的发送成本最小化。然而,出于简洁表示的目的并因为这种细节是广为公知的且无助于理解本发明,在图中未示出量化和反量化。 

频域中的维纳滤波器设计 

滤波器计算设备或功能块14-1至14-n中的每一个优选地在频域表征了FIR滤波器,其表示获得信号声道的原始时间包络的更精确再现所需的时域中的乘法改变。该滤波器问题可公式化为最小二乘问题,这通常称作维纳滤波器设计。例如参见X.Rong Li,Probability,Random Signals,and Statistics,CRC Press 1999,New York,pp.423。应用维纳滤波器技术具有减少将整形滤波器信息传输到解码器所需的附加位的优点。通常在时域设计并应用维纳滤波器的常规应用。 

可如下定义频域最小二乘滤波器设计问题:给定原始信号的DFT谱表示Y[k]以及这种原始声道的近似的DFT谱表示X[k],计算使式1最小化的一组滤波器系数(am)。注意,Y[k]和X[k]是复数值,由 此通常am也是复数。 

minam[E|Y[k]-Σm=0M-1amX[k-m]|2],---(1)

其中,k为谱索引,E为期望算子,并且M为所设计的滤波器的长度。 

可利用矩阵表达式将式1重新表示为如式2中所示: 

minam[E|Yk-ATXk|2],---(2)

其中 

Yk=[Y[k]]

XkT=X[k]X[k-1]...X[k-M+1]

并且 

AT=a0a1...aM-1..

因此,通过将式2中针对各滤波器系数的偏导数设置为零,简单地示出了由式3给出的对最小化问题的解决方案。 

A=RXX-1RXY,---(3)

其中 

并且 

RYXT=E(YKXk*)E(YKXk-1*)...E(YKXk-M+1*).

式3定义了使特定声道的原始谱(Y[k])与重构谱(X[k])之间的误差最小化的最优滤波器系数的计算。通常,针对每个输入信号的每个时间块来计算一组滤波器系数。 

在本发明方面的实际实施例中,采用12阶维纳滤波器,尽管本发明并不限于使用这种大小的维纳滤波器。这种实际实施例在DFT之后采用频域中的处理。因此,维纳滤波器系数是复数,且各滤波器要求发送二十四个实数。为了将这种滤波器信息有效地传输给解码器,可采用矢量量化(VQ)来对各滤波器的系数进行编码。可使用码本以 使得仅需要将索引发送到解码器来传输12阶复数滤波器信息。在实际实施例中,发现可使用具有24维(dimension)和16536个条目的VQ表码本。本发明并不限于使用矢量量化或使用码本。 

尽管以上描述假设使用DFT来估计谱内容并设计维纳滤波器,但是通常也可采用任意变换。 

图2示出了其中可采用本发明方面的解码器或解码处理环境的示例。这种编码器或编码处理可适于与如结合图1中的示例所描述的编码器或编码处理协同操作。经编码的位流,例如由图1中的配置所生成的位流,由信号发送或存储的任意适合模式来接收,并应用于位流解包器30,该位流解包器30必要时对位流进行解包以将经编码的音频信息与附带信息和是/否标志(如果位流中包括的话)分离开。附带信息优选地包括在改善应用于图1的编码配置的所述一个或更多个输入信号中的每一个的重构时使用的一组滤波器系数。 

在该示例中,假设存在与各输入信号相对应的再现信号,并且假设针对每个再现信号提供时间包络整形滤波器信息,尽管无需是这种情况,如前所述。因此,1至n组滤波器系数附带信息被示出为来自位流解包器30的输出。将各输入信号的滤波器系数信息应用于相应的整形滤波器36-1至36-n,下面将描述整形滤波器36-1至36-n的操作。每个滤波器可能还接收相应的是/否标志31-1至31-n,该标志表示滤波器在特定时间块期间是否应当是有效的。 

来自位流打包器30的附带信息还可以包括其他信息,例如在心理声学编码或参数立体声系统的情况下的声道间幅值差、声道间时间差或相位差、以及声道间互相关性。基于块的解码器42接收来自位流解包器30的附带信息以及来自位流解包器30的经时域到频域转换的音频信息。经由时域到频域转换器或转换功能块(“T/F”)46来应用来自解包器30的音频信息,时域到频域转换器或转换功能块(“T/F”)46可以与图1中的频域转换器或转换功能块(“T/F”)2-1至2-n中的任一个相同。 

基于块的解码器42提供一个或更多个输出,其中每一个都是对 图1中的对应输入信号的近似。尽管一些输入信号可能不具有对应的输出信号,但是图2的示例示出了输出信号1至n,其中每一个都是与图1的输入信号1至n中的相应一个输入信号相对应的近似。在该示例中,将解码器42的输出信号1到n中的每一个应用到相应的整形滤波器36-1到36-n,可将整形滤波器36-1到36-n中的每一个都实现为FIR滤波器。利用与要改进其重构输出的特定输入声道相关的相应滤波器信息,逐块地控制各FIR滤波器的系数。优选地通过将各FIR滤波器与滤波器36-1到36-n中的每一个中的基于块的解码器输出相卷积来实现时域上的乘法包络整形。由此,根据本发明方面的时间包络整形利用了时间频率二元性——时域上的卷积等效于频域上的乘法,反之亦然。然后将经解码和滤波的输出信号中的每一个应用于相应的频域到时域转换器或转换功能块(“F/T”)44-1到44-n,频域到时域转换器或转换功能块(“F/T”)44-1到44-n分别执行上述T/F的反函数,即,逆FFT,接着进行加窗和交叠相加。另选的是,在各个频域到时域转换器之后可采用适当的时域整形滤波器。例如,代替FIR滤波器系数和在时域中通过乘法采用的曲线,可发送n阶多项式曲线的n个多项式系数作为附带信息。尽管优选地采用维纳滤波器技术来将整形滤波器信息传输到解码器,但是可采用其他的频域和时域技术,例如在Truman和Vinton于2002年3月28日提交的并于2003年10月2日公开为US 2003/0187663 A1的题为“Broadband Frequency Translation for High Frequency Regeneration”的美国专利申请S.N.10/113858中所提出的技术。通过引用将所述申请的全部内容并入于此。 

实现 

本发明可以用硬件或软件或者两者的组合(例如,可编程逻辑阵列)来实现。除非特别指出,否则包括为本发明的一部分的算法并非固有地涉及任何特定计算机或其他设备。具体来说,可采用具有根据本文中的教习所写入的程序的各种通用机器,或者可更方便地构造更专用的设备(例如,集成电路)来执行所需的方法步骤。因此,可以 通过在一个或更多个可编程计算机系统(分别包括至少一个处理器、至少一个数据存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备或端口、以及至少一个输出设备或端口)上运行的一个或更多个计算机程序来实现本发明。对输入数据应用程序代码来执行本文描述的功能并生成输出信息。将输出信息按照已知的方式应用于一个或更多个输出设备。 

可按照任何希望的与计算机系统通信的计算机语言(包括机器,组件,或高级程序的、逻辑的、或面向对象的编程语言)来实现各个这种程序。在任何情况下,该语言可以是编译或解释语言。 

优选地将各个这种计算机程序存储在或下载到可由通用或专用可编程计算机读取的存储介质或设备(例如,固态存储器或介质,或者磁介质或光介质)上,以在计算机系统读取存储介质或设备时配置并操作计算机以执行本文所描述的过程。还考虑将该发明系统实现为配置有计算机程序的计算机可读存储介质,其中如此配置的存储介质使得计算机系统按照特定且预定的方式进行操作以执行本文所描述的功能。 

描述了本发明的多个实施例。然而,应当理解在不脱离本发明的精神和范围的情况下可以进行各种修改。例如,本文描述的一些步骤可以是与顺序无关的,因此可按照不同于所描述的顺序的顺序来执行这些步骤。 

引用并入 

通过引用将下面的专利、专利申请以及公报中的每一个的全部内容并入于此。 

AC-3 

ATSC标准A52/A:Digital Audio Compression Standard(AC-3),Revision A,Advanced Television Systems Committee,2001年8月20日。A/52A文档可从http://www.atsc.org/standards.html的万维网上获得。 

“Design and Implementation of AC-3 Coders,”Steve Vernon, IEEE Trans.Consumer Electronics,Vol.41,No.3,1995年8月。 

“The  AC-3 Multichannel Coder”,Mark Davis,Audio Engineering Society Preprint 3774,95th AES Convention,1993年10月。 

“High Quality,Low-Rate Audio Transform Coding for Transmission and Multimedia Applications”,Bosi等人,Audio Engineering Society Preprint 3365,93rd AES Convention,1992年10月。 

美国专利5583962;5632005;5633981;5727119;以及6021386。 

AAC 

ISO/IEC JTC1/SC29,“Information technology–very low bitrate audio-visual coding,”ISO/IEC IS-14496(Part 3,Audio),19961)ISO/IEC 13818-7.“MPEG-2 advanced audio coding,AAC”。International Standard,1997; 

M.Bosi,K.Brandenburg,S.Quackenbush,L.Fielder,K.Akagiri,H.Fuchs,M.Dietz,J.Herre,G.Davidson,以及Y.Oikawa:“ISO/IEC MPEG-2 Advanced Audio Coding”,Proc.of the 101stAES-Convention,1996; 

M.Bosi,K.Brandenburg,S.Quackenbush,L.Fielder,K.Akagiri,H.Fuchs,M.Dietz,J.Herre,G.Davidson,Y.Oikawa:“ISO/IEC MPEG-2 Advanced Audio Coding”,Journal of the AES,Vol.45,No.10,1997年10月,pp.789-814; 

Karlheinz Brandenburg:“MP3 and AAC explained”.Proc.of the AES 17th International Conference on High Quality Audio Coding,Florence,Italy,1999;以及 

G.A.Soulodre等人:“Subjective Evaluation of State-of-the-ArtTwo-Channel Audio Codecs”J.Audio Eng.Soc.,Vol.46,No.3,pp164-177,1998年3月。 

MPEG强度立体声 

美国专利5323396;5539829;5606618和5621855。 

美国公开专利申请US 2001/0044713,已公开。 

空间及参数编码 

Davis等人于2004年7月14日提交的题为“Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information”的美国临时专利申请S.N.60588256。 

于2003年2月6日公开的美国公开专利申请US 2003/0026441。 

于2003年2月20日公开的美国公开专利申请US 2003/0035553。 

于2003年11月27日公开的美国公开专利申请US 2003/0219130(Baumgarte & Faller)。 

Audio Engineering Society Paper 5852,2003年3月。 

于2003年10月30日公开的公开国际专利申请WO 03/090206。 

于2003年10月30日公开的公开国际专利申请WO 03/090207。 

于2003年10月30日公开的公开国际专利申请WO 03/090208。 

于2003年1月22日公开的公开国际专利申请WO 03/007656。 

Baumgarte等人于2003年12月25日公开的美国公开专利申请公报US  2003/0236583A1,“Hybrid  Multi-Channel/Cue Coding/Decoding of Audio Signals”,申请号为10/246570。 

Faller等人的“Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression”,Audio Engineering Society Convention Paper 5574,112th Convention,Munich,2002年5月。 

Baumgarte等人的“Why Binaural Cue Coding is Better than Intensity Stereo Coding”,Audio Engineering Society Convention Paper 5575,112th Convention,Munich,2002年5月。 

Baumgarte等人的“Design and Evaluation of Binaural Cue Coding Schemes”,Audio Engineering Society Convention Paper 5706,113th Convention,Los Angeles,2002年10月。 

Faller等人的“Efficient Representation of Spatial Audio Using Perceptual Parameterization”,IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001,New Paltz,New York,2001年10月,pp.199-202。 

Baumgarte等人的“Estimation of Auditory Spatial Cues for Binaural Cue Coding”,Proc.ICASSP 2002,Orlando,Florida,2002年5月,pp.II-1801-1804。 

Faller等人的“Binaural Cue Coding:A Novel and Efficient Representation of Spatial Audio”,Proc.ICASSP 2002,Orlando,Florida,2002年5月,pp.II-1841-II-1844。 

Breebaart等人的“High-quality parametric spatial audio coding at low bitrates”,Audio Engineering Society Convention Paper 6072,116th Convention,Berlin,2004年5月。 

Baumgarte等人的“Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing”,Audio Engineering Society Convention Paper 6060,116th Convention,Berlin,2004年5月。 

Schuijers等人的“Low complexity parametric stereo coding”,Audio Engineering Society Convention Paper 6073,116th Convention,Berlin,2004年5月。 

Engdegard等人的“Synthetic Ambience in Parametric Stereo Coding”,Audio Engineering Society Convention Paper 6074,116thConvention,Berlin,2004年5月。 

其他 

美国专利5812971,Herre,“Enhanced Joint Stereo Coding Method Using Temporal Envelope Shaping”,1998年9月22日。 

Herre等人的“Intensity Stereo Coding”,Audio Engineering Society Prepint 3799,96th Convention,Amsterdam,1994。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号