首页> 中国专利> 用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统

用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

在一类实施方式中，提供了一种音频编码系统（通常是被配置成生成单一（“统一”）比特流的感知编码系统，该单一比特流与第一解码器和第二解码器兼容（即，可由第一解码器和第二解码器解码）；第一解码器被配置成对根据第一编码协议（例如，多声道Dolby Digital Plus协议或DD+协议）编码的音频数据进行解码，第二解码器被配置成对根据第二编码协议（例如，立体声AAC协议、HE AAC v1协议或HE AAC v2协议）编码的音频数据进行解码）。统一比特流可以包括能够由第一解码器解码（而被第二解码器忽略）的编码数据（例如，数据串）和能够由第二解码器解码（而被第一解码器忽略）的编码数据（例如，其他数据串）。实际上，当该比特流被第一解码器解码时，第二编码格式在该统一比特流中被隐藏；当该比特流被第二解码器解码时，第一编码格式在该统一比特流中被隐藏。根据本发明生成统一比特流的格式可以消除对遍及整个媒体链和/或生态系统的元素进行转码的需要。本发明的其他方面是由本发明的编码器的任意实施方式执行的编码方法、由本发明的解码器的任意实施方式执行的解码方法和存储用于实施本发明方法的任意实施方式的代码的计算机可读介质（例如，磁盘）。

著录项

公开/公告号CN103460288A

专利类型发明专利
公开/公告日2013-12-18

原文格式PDF
申请/专利权人杜比实验室特许公司;杜比国际公司;
展开▼

申请/专利号CN201280017327.9
发明设计人杰弗里·C·里德米勒;法哈德·法哈尼;米夏埃尔·舒格;雷古纳森·拉达克里希南;马克·S·文顿;
展开▼

申请日2012-04-05
分类号G10L19/16(20130101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人杜诚;李春晖
地址美国加利福尼亚州
入库时间 2024-02-19 22:44:42

法律信息

法律状态公告日

法律状态信息

法律状态
2017-10-24

专利实施许可合同备案的生效 IPC(主分类):G10L19/16 合同备案号:2017990000387 让与人:杜比实验室特许公司|杜比国际公司受让人:青岛海尔电子有限公司发明名称:用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统申请公布日:20131218 授权公告日:20150819 许可种类:普通许可备案日期:20170926 申请日:20120405

专利实施许可合同备案的生效、变更及注销
2015-08-19

授权

授权
2014-01-15

实质审查的生效 IPC(主分类):G10L19/16 申请日:20120405

实质审查的生效
2013-12-18

公开

公开

说明书

相关申请的交叉引用

本申请要求2011年4月8日提交的美国专利临时申请No.61/473,257、 2011年4月9日提交的美国专利临时申请No.61/473,762和2012年3月 8日提交的美国专利临时申请No.61/608,421的优先权，其中每个申请的全部内容都通过引用合并到本文中。

技术领域

本发明涉及音频编码系统（例如，感知编码系统）以及由该音频编码系统实施的编码方法。在一类实施方式中，本发明涉及一种音频编码系统，其被配置成生成同时与第一解码器和第二解码器兼容（即，可由第一解码器和第二解码器解码）的单一（“统一”）比特流，第一解码器被配置成根据第一编码协议（例如，多声道杜比数字+（Dolby Digital Plus）（E AC-3）或DD+协议）对编码的音频数据进行解码，第二解码器被配置成根据第二编码协议（例如，AAC、HE AAC v1、或HE AAC v2协议）对编码的音频数据进行解码。

背景技术

在包括权利要求的整个公开内容中，对信号或数据执行操作（例如，滤波或变换）的表达从广义上用于表示直接对信号或数据进行操作，或对信号或数据的经处理的版本（例如，在对其进行操作之前已经经历了初步滤波的信号的版本）进行操作。

在括在权利要求的整个公开内容中，表达“系统”从广义上用于表示设备、系统或子系统。例如，被配置成对数据进行编码的子系统可以指编码器系统（或编码器），包括这样的子系统的系统也可以被称为编码系统（或编码器）。

表达“编码协议”在本文中用于表示根据其执行特定类型的编码的一组规则。通常，在定义特定类型的编码的规范中提出这些规则。

表达“解码协议”在本文中用于表达根据其对编码数据进行解码的一组规则，其中该编码数据已经根据特定编码协议进行了编码。通常，在也定义特定编码协议的规范中提出这些规则。

在包括在权利要求的整个公开内容中，表达“感知编码系统”（用于对确定音频节目的音频数据进行编码，可以通过转换至一个或更多个扬声器馈送以及使用至少一个扬声器将扬声器馈送转换至声音来对该音频数据进行呈现，该声音具有被人类收听者感知的品质）表示被配置成以下述方式来对音频数据进行压缩的系统：当对压缩数据进行解压缩并且使用至少一个扬声器来呈现产生的解码数据时，收听者所感知所产生的声音，而在感知品质上没有明显的损失。感知编码系统除了对音频数据执行压缩以外还对音频数据执行至少一个其他操作（例如，上混合或下混合）。

感知编码系统一般用于压缩（以及通常还用于下混合或上混合）音频数据。这种广泛使用的系统的示例包括多声道Dolby Digital Plus（“DD+”）系统（与所公知的由先进电视系统委员会有限公司采用的增强型AC-3或 “E AC-3”数字音频压缩协议兼容）、MPEG AAC系统（与公知的先进音频编码或“AAC”音频压缩协议兼容）、HE AAC系统（与公知的MPEG 高效先进音频编码v1或“HE AAC v1”音频压缩协议，或者公知的高效先进音频编码v2或“HE AAC v2”音频压缩协议兼容）和Dolby Plus系统（可用于将包括DD+（或杜比数字（Dolby Digital））元数据的比特流随HE AAC v2编码音频输出，以使得适当的解码器能够从该比特流中提取元数据并且对HE AAC v2音频进行解码）。

常规的解码器（称为多流解码器）能够对DD+编码比特流或 Dolby Plus编码比特流进行解码。但是，该解码器被实施成与DD+解码协议和HE AAC v2解码协议兼容，并且从Dolby Plus比特流中提取DD+ （或Dolby Digital）元数据。但是，常规的DD+解码器（与DD+解码协议而不是HE AAC v2解码协议兼容）不能对Dolby Plus编码比特流或常规的HE AAC v2编码比特流进行解码。而且常规的HE AAC v2解码器（仅与HE AAC v2解码协议而不与DD+解码协议兼容，并且配置成从Dolby Pulse比特流中提取DD+（或Dolby Digital）元数据）也不能对DD+编码比特流进行解码。常规的Dolby Pulse解码器（与HE AAC v2解码协议兼容并且被配置成从Dolby Pulse比特流中提取DD+（或Dolby Digital）元数据，并且不与DD+解码协议兼容）也不能对DD+比特流进行解码。

会期望以生成编码数据的单一比特流的方式来对音频数据进行编码，该单一比特流（从能够由第一常规解码器或第二常规解码器中任一解码器解码的意义上来讲）与第一常规解码器和第二常规解码器兼容，第一常规解码器被配置成对根据第一常规编码协议（例如，DD+协议）编码的音频数据进行解码，而第二常规解码器被配置成对根据第二编码协议（例如， AAC或HE AAC v2协议）编码的音频数据进行解码。

在典型的实施方式中，本发明的编码器是有效地将两个独立的感知音频编码系统一成单个编码系统和比特流格式的交叉平台音频编码系统的关键要素。例如，本发明的编码器的一些实施方式将DD+（E AC-3）编码系统和Dolby Pulse（HE-AAC）编码系统组合成单个强大高效的感知音频编码系统和格式，其能够生成可由常规DD+解码器或常规HE AAC v2（或HE AAC v1或AAC）解码器中任一解码器来解码的单一比特流。根据本发明的编码器的这种实施方式输出的比特流因此与设备类型（例如，AVR、STB、数字媒体适配器、移动电话、便携式媒体播放器、PC 等）无关地在世界范围内发现的绝大多数所部署的媒体播放设备兼容。

发明内容

在一类实施方式中，本发明是被配置成生成与第一解码器兼容（即，可由第一解码器解码）并且与第二解码器兼容的单一（“统一”）比特流的一种音频编码系统（通常为一种感知编码系统），第一解码器被配置成根据第一编码协议（例如，多声道Dolby Digital Plus（E AC-3）或DD+协议）对编码的音频数据进行解码，第二解码器被配置成根据第二编码协议（例如，MPEG AAC、HE AAC v1或HE AAC v2协议）对编码的音频数据进行解码。该比特流可以包括可由第一解码器解码（而被第二解码器忽略）的编码数据（例如，数据突发）和可由第二解码器解码（而被第一解码器忽略）的编码数据（例如，其他数据突发）两者。实际上，当由第一解码器对比特流进行解码时，第二编码格式在统一比特流中被隐藏，而当由第二解码器对比特流进行解码时，第一编码格式在统一比特流中被隐藏。此外，本发明不依赖于第一解码器和第二解码器同时出现在系统和/ 或设备内。因此，仅包括只与统一比特流的协议之一兼容的单个解码器的设备或系统受本发明的支持。在该情况下，统一比特流的未知/不支持部分会被解码器忽略。根据本发明生成的统一比特流的格式可以消除对遍及整个媒体链和/或生态系统的各个要素进行转码的需要。

在典型的实施方式中，本发明的编码器是交叉平台音频编码系统的关键要素，该交叉平台音频编码系统有效地将两个或更多个独立的感知音频编码系统（每个系统实施不同的编码协议）统一成输出具有统一格式的单一比特流的单个系统，以使得该比特流可以由两个或更多个解码器（每个解码器被配置成根据所述编码协议中的不同一个协议来对所编码的音频数据进行解码）中的每一个来解码。例如，Dolby Digital Plus（E AC-3）和Dolby Pulse（HE-AAC v2）系统可以根据本发明的一类实施方式而组合成与不依赖于设备类型遍及世界部署的大部分媒体播放设备（例如， AVR、STB、数字媒体适配器、移动电话、便携式媒体播放器、PC等）兼容的单个强大有效的感知音频编码系统及格式。本发明的典型实施方式的许多益处之一是对于要在媒体传递系统的范围（例如，宽的范围）上传送的编码音频比特流（其可由各自被配置成根据不同的编码协议来对所编码的音频数据进行解码的两个或更多个解码器来解码）的能力，其中传递系统中的每个通常（即，在本发明之前）仅支持根据所述编码协议之一而编码的数据。

常规的感知音频编码系统（例如，Dolby Digital Plus、MPEG、AAC、 MPEG HE-AAC、MPEG Layer3、MPEG Layer2等）通常提供标准化比特流元素以使得能够在比特流自身中传送附加（任意）数据。该附加（任意）数据在对包括在比特流中的编码音频进行解码期间被跳过（即，被忽略），但是可以用于除了解码以外的其他目的。不同的常规音频编码标准使用唯一的命名法（表达在它们的相关标准文献中）来表达这些附加数据字段。在本公开内容中，该一般类型的比特流元素的示例被称为辅助数据、跳过字段、数据流元素、填充元素或辅助数据，并且表达“辅助数据”经常用作包括任何/所有这些示例的一般性表达。

组合的比特流（其根据本发明的实施方式而生成）的示例性数据声道（通过第一编码协议的“辅助”比特流元素来实现）可以传送第二（独立）音频比特流（根据第二编码协议来编码），分割成N样本块并且复用成第一比特流的“辅助数据”字段。第一比特流依然可由适当（补充）的解码器来解码。此外，第一比特流的“辅助数据”可以被读出、被重新组合成第二比特流并且可以由支持第二比特流的语法的解码器来解码。

显然，在第一比特流和第二比特流的角色颠倒的情况下上述情况也是可能的，即，将第一比特流的数据块复用成第二比特流的“辅助数据”。

在一些实施方式中，本发明的编码系统被配置成通过以第一比特流是第二比特流的辅助数据并且第二比特流是第一比特流的辅助数据的方式将第二比特流插入（复用）至第一比特流的辅助数据位置中，来将编码音频数据（根据第一协议来编码）的第一比特流与编码音频数据（根据第二协议来编码）的第二比特流进行组合。得到的组合比特流（同时）是第一音频编解码比特流格式（“格式1”）和第二音频编解码比特流格式（“格式2”）的有效比特流。当统一比特流被馈送至被配置成以格式1对编码数据进行解码的解码器（“解码器1”）时，包括在比特流中的音频（根据格式1来编码）会被解码，并且如果相同的比特流被提供给（例如，同时提供给）被配置成以格式2对编码数据进行解码的另一个解码器（“解码器2”）时，包括在比特流中的音频（根据格式2来编码）会被解码。重要地，无需原始的第一比特流或第二比特流的解复用、提取和/或重新组合。本发明的优选实施方式将5.1声道DD+（Dolby Digital Plus（E AC-3））比特流与双声道MPEG HE-AAC比特流组合成单一的统一比特流。但是本发明不限于这些具体格式和声道模式。

在一类实施方式中，本发明的编码器包括两个编码子系统（这些子系统中的每个被配置成根据不同的协议来对音频数据进行编码），并且被配置成组合各个子系统的输出以生成双格式（统一）比特流。在这类实施方式中，编码器被配置成使用共享或共用的比特池（在编码子系统之间共享的输入比特）来进行操作并且在编码系统之间分配可用比特（在所共享的比特池中）以优化统一比特流的总体音频质量（例如，取决于所共享的比特池的统计分析结果，使用上述编码子系统之一来或多或少地对可用比特进行编码，而使用所述编码子系统中的另一个来对所剩下的可用比特进行编码，以及将两个编码子系统的输出复用在一起来生成统一比特流）。在一些这样的实施方式中，编码器被配置成通过将其一些比特编码为 HE-AAC数据而将剩下的比特编码为DD+数据来对共用比特池进行操作（或将整个共用比特池编码为HE-AAC数据或DD+数据），并且编码器实施统计复用操作以优化其DD+编码子系统与HE-AAC编码子系统之间的比特分配，从而产生经优化的输出、统一比特流。为了减少对于来自共用池的比特的同步需求（该类中的编码器的两个编码子系统的所需求的），两个编码子系统可以被去同步N个音频样本和/或块（利用自适应延迟），例如，在当表示复杂或困难音频段和/或场景正在被编码时。在一些实施中，所共享的比特池提供用于确保（统一输出比特流的）数据帧的组表示输入音频样本的固定数量或输入比特的特定数量的机制（以简化如比特流打包以及与视频的复用等下游处理）。在图5中被标记为“共用比特池/ 统计复用器”的块是被配置为进行以下操作的（该类中的编码器的）示例性要素：优选地使用统一输出比特流的输入比特率和最大超帧长度的知识、通过确定有多少比特的输入数据（由从E AC-3编码子系统的时间- 频率域变换级输出的频域系数来表示）要赋予E AC-3编码的频域系数的每个量化的尾数以及有多少比特的输入数据（由从HE AAC v1编码子系统的“MDCT”（改进型离散余弦变换）级输出的频域系数来表示）要赋予从HE AAC v1子系统输出的量化的HE AAC v1码字，来在两个编码系统（图5右侧E AC-3编码系统以及图5的左侧的HE AAC v1编码子系统）之间分配来自共享比特池中的比特。在一些实施中，图5（或图6、图7或图8）的实施方式被配置成：根据所共享的比特预算来在两个编码子系统之间分配来自共享比特池的可用比特，和/或以取决于共享比特池中的音频数据的感知复杂度和熵中至少之一的方式来分配来自共享比特池的可用比特。

与图5系统相比，常规E AC-3编码器可以包括被配置成以独立于对将E AC-3编码数据复用成统一比特流的考虑的方式来确定要将多少比特的输入数据分配给E AC-3编码频域系数（由E AC-3编码器生成）的每个量化尾数的比特分配元件，并且常规的HE AAC v1编码器可以包括被配置成以独立于对将HE AAC v1编码数据复用成同一比特流的考虑的方式确定要将多少比特的输入数据分配给每个量化的HE AAC v1码字（由 HE AAC v1编码器生成）的比特分配元件。优选地，所输入的共享比特池的比特率以及（所输出的组合比特流的）最大超帧长度已知，并且用于优化本发明的编码器的在两个（例如，DD+和HEAAC）编码子系统之间执行的比特分配。

优选地，能够支持统一比特流（根据本发明的典型实施方式来生成以包括第一音频编解码比特流格式的第一编码音频以及第二音频编解码比特流格式的第二编码音频）可以对第一编码音频进行解码以生成第一音频并且还可以仅依赖于（例如，根据）包括在统一比特流中的元数据（例如，响度和动态范围信息）直接控制播放响度和动态范围（或是修改第一音频的处理），并且能够支持统一比特流的第二解码器可以对第二编码音频进行解码以生成第二音频，并且还可以仅依赖于（例如，根据）包括在统一比特流中的元数据（例如，响度和动态范围信息）来直接控制第二音频的播放响度和动态范围（或是修改第二音频的处理）。例如，元数据是从统一比特流中提取并且由相关的解码器使用以根据元数据修改处理。优选地，统一系统和比特流格式的有效性是通过以单数形式但是任一解码器都可以对其进行处理的方式传输这样的元数据被进一步改进的。

本发明的一些实施方式提供了一种用于以单数形式在统一比特流（例如，包括编码音频数据的仅1个或2个声道）中传送附加的有效负载（例如，用在MPEG环绕处理中的一种类型的空间编码信息）的有效方法，其中附加的有效负载直接适用于由解码统一比特流的比特而生成的解码音频的每个流。

由本发明的典型实施方式生成的统一比特流还支持解交织（例如，用于需要可伸缩数据速率和/或端点设备可伸缩性的应用）。在一些实施方式中，统一比特流可以被解交织（例如，通过生成所述统一比特流的编码器，其中编码器被配置成执行解交织）以生成第一比特流（包括根据第一编码协议编码的音频数据）和第二比特流（包括根据第二编码协议编码的音频数据），以使得第一比特流和第二比特流中的每个与被配置成根据各自的编码协议对编码数据进行解码的解码器直接兼容。在其他实施方式中，统一比特流在解交织比特流之一的解交织处理期间必须经历附加的处理步骤以变得与其各自的解码器兼容。为了简化可伸缩性（解交织性），统一比特流可以传送适于每种解交织比特流类型的附加错误检测数据和/或信息（例如，错误检测数据、错误检测信息、CRC和HASH值中至少之一）。这消除了对在解交织处理期间对错误检测数据和/或信息进行重新计算的附加处理的需要。

本发明的编码器的一些实施方式实施以下特征中的一个或更多个：生成包括根据两种或更多种编码协议而编码的编码数据的超帧的统一比特流（例如，每个超帧由根据一种协议编码的X帧编码音频数据组成，上述X帧编码音频数据与根据另一种编码协议编码的Y帧编码音频数据复用，以使得超帧包括X+Y帧编码音频数据）；转码（例如，本发明的编码器包括被耦合的编码子系统，该子系统被配置成重新编码（例如，根据不同的编码协议）通过对来自统一比特流的比特进行解码而生成的解码数据）；用于生成或处理BSID（比特流标识）或HASH（通过DSE）值的装置；CRC重新计算；以及将解同步流生成器与MPEG2/4系统定时模型联系起来以考虑延迟偏移。

在一类实施方式（例如，将要参考图2或图3来描述）中，本发明编码器生成包括作为DD+流的“辅助数据”的HE-AAC数据（根据HE-AAC 协议编码的数据）、和作为HE-AAC流的“数据流”元素（另一种类型的辅助数据）的DD+数据（根据DD+协议编码的数据）的统一比特流。 HE-AAC数据可以通过常规的HE-AAC解码器（其忽略了DD+数据）来进行解码，而DD+数据可以通过常规DD+解码器（其忽略了HE-AAC数据）来解码。这些实施方式中的每一个所生成的统一比特流受到对每秒每帧的最大比特数的MPEG限制（由于针对48kHz HE-AAC2声道MPEG 最大组合比特流为288千比特/秒，或在48kHz AAC-LC的情况下，最大组合比特率为576千比特/秒）。但是，由这些实施方式中的每一个所生成的统一比特流不需要将HE-AAC数据与DD+数据彼此区分开的任何特殊编码元件（常规DD+解码器或常规HE-AAC解码器都可以做到）。

在另一类实施方式中，本发明的编码器生成包括作为DD+编码数据流（DD+解码器会对其解码）的独立子流发送的DD+数据（根据DD+协议编码的数据）、和作为DD+编码数据流（DD+解码器会对其进行忽略）的第二（独立或相关的）DD+子流发送的HE-AAC数据（根据HE-AAC 协议编码的数据）。该实施方式优选地为第一实施方式，因为其不受每秒每帧的最大比特数的MPEG限制。但是，会需要常规HE-AAC解码器装备有将HE-AAC数据从统一比特流分离出的简单的附加元件（即，能够识别哪些统一比特突发属于作为包括HE-AAC数据的子流的“第二”DD+ 子流的元件）以便由常规的HE-AAC解码器进行解码。

本发明的其他方面是由本发明的编码器的任意实施方式执行的编码方法（例如，编码器被编程或以其他方式配置成执行的方法）、由本发明的解码器的任意实施方式执行的解码方法（例如，解码器被编程或以其他方式配置成执行的方法）和存储有用于实施本发明方法的任意实施方式的代码的计算机可读介质（例如，磁盘）。

附图说明

图1是由本发明的编码系统的实施方式生成的比特流的一部分的图。该比特流包括第一编码音频数据（根据第一编码协议来编码）和第二编码音频数据（根据第二编码协议来编码），并且可以通过第一解码器（其对第一编码音频数据进行解码而忽略第二编码音频数据）或第二解码器（其对第二编码音频数据进行解码而忽略第一编码音频数据）来解码；

图2是由本发明的编码系统的另一种实施方式生成的比特流的一部分的图。该比特流包括第一编码音频数据（根据第一编码协议来编码）和第二编码音频数据（根据第二编码协议来编码），并且可以由第一编码器（其对第一编码音频数据进行解码而忽略第二编码音频数据）或第二解码器（其对第二编码音频数据进行解码而忽略第一编码音频数据）；

图3是由本发明的编码系统的另一种实施方式生成的比特流的一部分的图。该比特流包括第一编码音频数据（根据第一编码协议来编码）（图 3A）和第二编码音频数据（根据第二编码协议来编码）（图3B），并且可以由第一解码器（对第一编码音频数据进行解码并且忽略第二编码音频数据）（图3C）或由第二解码器（对第二编码音频数据进行解码并且忽略第一编码音频数据）（图3D）来解码；

图4是包括本发明的编码器（编码器10）和与该编码器兼容的两个解码器（12和14）的实施方式的系统的框图；

图4A是包括本发明的编码器（编码器90）和与该编码器兼容的两个解码器（12和91）的另一种实施方式的系统的框图。

图5是本发明的编码器的实施方式的示出了编码器的模块和由编码器执行的操作的图；

图6是本发明的编码器的另一种实施方式的示出了编码器的模块和由编码器执行的操作的图；

图7是本发明的编码器的另一种实施方式的示出了编码器的模块和由编码器执行的操作的图；

图8是本发明的编码器的另一种实施方式的示出了编码器的模块和由编码器执行的操作的图；以及

图9是本发明的编码器的输出统一比特流的实施方式和可能向其提供统一比特流的系统及设备的示例的图。

具体实施方式

本发明的许多实施方式在技术上是可行的。根据本公开内容，如何实施上述实施方式对于本该领域普通技术人员很明显。将参考图1至图9 对本发明的系统及方法的实施方式进行描述。

图1是由本发明的编码系统的实施方式生成的统一比特流的一部分的图。该比特流包括第一编码音频数据41和47（根据第一编码协议来编码）和第二编码音频数据44和51（根据第二编码协议来编码），并且可以由第一解码器（其对第一编码音频数据进行解码而忽略第二编码音频数据）或由第二解码器（其对第二编码音频数据进行解码而忽略第一编码音频数据）来解码。生成图1比特流的编码器将同步比特40插入到紧接在音频数据41之前的比特流中，并且将控制比特42插入到紧接在音频数据 41之后的比特流中，以及将帧结尾比特45插入到比特44A之后的比特流中。第一解码器会将同步比特40识别为要被解码的数据（根据第一协议来编码）的帧（图1中的“帧1”）的开始，并且将控制比特42识别为要被忽略的（帧的）辅助数据开始，以及将帧结尾比特45识别为帧的结尾。生成图1比特流的编码器还将同步比特46插入到紧接在音频数据47之前的比特流中，并且将控制比特48插入到紧接在音频数据47之后的比特流中，以及将帧结尾比特53插入到比特52之后的比特流中。第一解码器会将同步比特46识别为要被解码的数据（根据第一协议来编码）的另一个帧（图1中的“帧2”）的开始，并且将控制比特48识别为要被忽略的（帧的）辅助数据的开始以及将帧结尾比特53识别为帧的结尾。

生成图1比特流的编码器将同步比特43插入到紧接在音频数据44 之前的比特流中，并且将控制比特44A插入到紧接在音频数据44之后的比特流中，以及将帧结尾比特49插入到比特48之后的比特流中。第二解码器会将同步比特43识别为要被解码的数据（根据第二协议来编码）的帧（图1中的“帧1”）的开始（并且会忽略同步比特43之前的比特），并且会将控制比特44A识别为要被忽略的（帧的）辅助数据的开始，以及将帧结尾比特49识别为帧的结尾。生成图1比特流的编码器还将同步比特50插入到紧接在音频数据51之前的比特流中，并且将控制比特52 插入到紧接在音频数据51之后的比特流中。第二解码器可以将同步比特 50识别为要被解码的数据（根据第二协议来编码）的另一个帧（图1中的“帧2”）的开始，并且将控制比特52识别为要被忽略的（帧的）辅助数据的的开始。

图2是由本发明的编码系统的另一种实施方式生成的比特流的一部分的图。该比特流包括第一编码音频数据（根据第一编码协议即DD+协议来编码）和第二编码音频数据（根据第二编码协议来编码，即根据Dolby Pulse协议生成的HE AAC v2编码音频），并且可以由第一解码器（其对第一编码音频数据进行解码而忽略第二编码音频数据）或第二解码器（其对第二编码音频数据进行解码而忽略第一编码音频数据）来解码。生成图 2比特流的编码器将以下比特序列插入到比特流中：紧接在DD+编码音频数据的突发前的同步比特60、紧接在该音频数据之后的表示DD+解码器应该跳过比特61的控制比特、另一个DD+编码音频数据突发、紧接在该音频数据之后的表示DD+解码器应该跳过比特62的控制比特、另一个 DD+编码音频数据突发、紧接在该音频数据之后的表示DD+解码器应该跳过比特63的控制比特、以及比特63之后的帧结尾比特44。第一解码器会将同步比特60识别为要被解码的数据（根据DD+协议编码）的帧（图 2中的“帧n”）的开始，而会忽略比特61、62和63，并且会将帧结尾比特64识别为帧的结尾。生成图2比特流的编码器还将以下比特序列插入到比特流中：紧接在DD+编码音频数据的突发之前的同步比特64A、紧接在该音频数据之后的表示DD+解码器应该跳过比特65的控制比特、另一个DD+编码音频数据突发、紧接在该音频数据之后表示DD+解码器应该跳过比特66的控制比特、另一个DD+编码音频数据突发、以及该音频数据之后的帧结尾比特66A。第一解码器会将同步比特64A识别为要被解码的数据（根据DD+协议来编码）的帧（图2中的“帧n+1”）的开始而忽略比特65、66和66A，并且会将帧结尾比特64A识别为帧的结尾。编码器还将以下比特序列插入到比特流中：紧接在DD+编码音频数据的突发之前的同步比特67、紧接在该音频数据之后的表示DD+解码器应该跳过比特68的控制比特、另一个DD+编码音频数据突发、紧接在该音频数据之后的表示DD+解码器应该跳过比特69的控制比特、以及比特66 之后的帧结尾比特70。第一解码器会将同步比特67识别为要被解码的数据（根据DD+协议来编码）的帧（图2中的“帧n+2”）的开始而会忽略比特68和69，并且会将帧结尾比特70识别为帧的结尾。生成图2比特流的编码器还将以下比特序列插入到比特流中：紧接在DD+编码音频数据的突发之前的同步比特71、紧接在该音频数据之后的表示DD+解码器应该跳过比特72的控制比特、另一个DD+编码音频数据突发、紧接在该音频数据之后的表示DD+解码器应该跳过比特73的控制比特、另一个 DD+编码音频数据突发、以及在该音频数据之后的帧结尾比特74。第一解码器会将同步比特71识别为要被解码的数据（根据DD+协议来编码）的帧（图2中的“帧n+3”）的开始而忽略比特72和73，并且会将帧结尾比特74识别为帧的结尾。

生成图2比特流的编码器将以下比特序列插入到比特流中：紧接在 HE AAC v2编码音频数据突发之前的同步比特80、紧接在该音频数据之后的表示HE AAC v2解码器应该跳过比特81（即，将其视为要被忽略的数据流元素）的控制比特、紧接在比特81之后的表示HE AAC v2解码器应该跳过比特82的控制比特、紧接在比特82之后的表示HE AAC v2解码器应该跳过比特83的控制比特、以及在比特83之后的帧结尾比特44。第二解码器会将同步比特80识别为要被解码的数据（根据HE AAC v2 协议来编码）的帧（图2中的“帧m”）的开始而忽略比特81、82和83，以及会将帧结尾比特84识别为帧的结尾。生成图2比特流的编码器还将以下比特序列插入到比特流中：紧接在HE AAC v2编码音频数据突发之前的同步比特84A、紧接在该音频数据之后的表示HE AAC v2解码器应该跳过比特85（即，将其视为要被忽略的数据流元素）的控制比特、紧接在比特85之后的表示HE AAC v2解码器应该跳过比特87的控制比特、以及比特87之后的帧结尾比特88。第二解码器会将同步比特84A识别为要被解码的数据（根据HE AAC v2协议来编码）的帧（图2中的“帧 m+1”）的开始而忽略比特85、86和87，以及会将帧结尾比特88识别为帧的结尾。

图2比特流因此表示编码音频数据的一系列超帧，每个超帧包括编码音频数据的7个帧：DD+编码数据的第一帧（例如，图2的帧“n”）、HE AAC编码数据的第一帧（例如，图2的帧“m”）、DD+编码数据的第二帧（例如，图2的帧“n+1”）、HE AAC编码数据的第二帧、DD+编码数据的第三帧、HE AAC编码数据的第三帧和DD+编码数据的第四帧。

图3是由本发明的编码系统的另一种实施方式生成的比特流的一部分的图。该比特流包括根据第一编码协议（DD+协议）来编码的“第一编码音频数据”和根据第二编码协议来编码的“第二编码音频数据”（根据 Dolby Pulse协议生成的HE AAC编码音频），并且可以由第一解码器（其对第一编码音频数据进行解码而忽略第二编码音频数据）或第二解码器（其对第二编码音频数据进行解码而忽略第一编码音频数据）。

图3数据流表示编码音频数据的一系列超帧，每个超帧（表示128 毫秒的时间窗）包括编码音频数据的7个帧：DD+编码数据的第一帧（例如，图3的DD+帧1）、HE AAC编码数据的第一帧（例如，图3的HE AAC 帧1）、DD+编码数据的第二帧（例如，图3的DD+帧2）、HE AAC编码数据的第二帧（例如，图3的HE AAC帧2）、DD+编码数据的第三帧（例如，图3的DD+帧3）、HE AAC编码数据的第三帧（例如，图3的HE AAC 帧3）和DD+编码数据的第四帧（例如，图3的DD+帧4）。

生成图3比特流的编码器将所表示的比特序列插入到比特流中的HE AAC编码音频数据的每个帧中：紧接在HE AAC编码音频数据突发之前的同步比特（“ADTS”）、接在该HE AAC编码音频数据之后的元数据、以及接在该元数据后的帧结尾比特（TERM）。在对图3比特流进行解码的操作中，第二解码器将同步比特识别为要被解码的数据（根据HE AAC 协议来编码）的帧的开始，将帧结尾比特识别为帧的结尾而忽略DD+编码数据的每个帧（因为每个这样的帧出现在第一HE AAC帧开始之前，或在某个HE AAC帧的结尾之后而在下一个HE AAC帧的开始之前）。

生成图3比特流的编码器将所指示的比特序列插入到比特流中的 DD+编码数据的每个帧：同步比特（“SYNC”）、然后是DD+编码音频数据突发之前的元数据、在该编码音频数据之后的表示DD+解码器（第一解码器）应该将接下来的比特视为要被跳过（出现在这样的比特突发中的 HE AAC编码数据的每个帧要被DD+解码器跳过）的数据（AUX_data 或Skip数据）的控制比特、以及有时然后是附加的DD+编码数据和/或控制比特、以及帧的结尾处的CRC比特（紧接在DD+编码数据的下一个帧的开始处的同步比特之前）。在HE AAC编码数据的每个帧之后，编码器插入控制比特（图3中的“DSE”），其指示第二解码器应该忽略（作为 HE AAC“数据流元素”）后续比特，直到第二解码器识别了标识HE AAC 编码数据的下一个帧的下一个同步比特（“ADTS”）为止。这些后面的控制比特（图3中的“DSE”）出现在会被第一解码器跳过的DD+帧的间隔期间。

图4是包括本发明的编码器（编码器10）和两个解码器（12和14）的实施方式的系统的框图，这两个解码器（12和14）从解码器12和14 中的每个解码器都能够对包括在由编码器10生成（输出）的比特流中的编码音频数据进行解码的意义上来讲与编码器10兼容。编码器10优选地是感知编码系统，并且被配置为生成包括根据第一编码协议编码的音频数据和根据第二编码协议编码的音频数据中之一或两者的单一（“统一”）比特流。该统一比特流可由解码器12（其在一些实施方式中是常规解码器，并且被配置为对根据第一编码协议编码的音频数据而不是根据第二编码协议编码的数据进行解码）和解码器14（其在一些实施方式中是常规解码器，并且被配置为对根据第二编码协议编码的音频数据而不是根据第一编码协议编码的数据进行解码）来解码。在一些实施方式中，第一编码协议是多声道Dolby Digital Plus（DD+）协议而第二编码协议是立体AAC、 HE AAC v1或HE AAC v2协议。

统一比特流可以包括可由解码器12解码（而被解码器14忽略）的编码数据（例如，数据突发）和可由解码器14解码（而被解码器12忽略）的编码数据（例如，其他数据突发）。实际上，当比特流由解码器12解码时第二编码格式在统一比特流中被隐藏，并且当比特流由解码器14解码时第一编码格式在统一比特流中被隐藏。

图5是本发明的编码器的实施方式的、示出了编码器的模块和编码器所执行的操作的图。音频样本被设置为至图5编码器的输入信号调节块 20的音频样本。在典型的实施中，样本是表示输入音频数据的6个声道的PCM音频样本。响应于输入音频数据，图5编码器生成单一的统一比特流，并且在比特流打包与格式化块30的输出处设置统一流。

图5编码器包括HE AAC编码子系统21（其被配置为在输入数据在块20中经历调节之后根据HE AAC v1编码协议来编码一些或所有输入数据）和DD+编码子系统22（其被配置为在输入数据在块20中经历调节之后根据E AC-3编码协议来编码一些或所有输入数据）。块30可用于对从子系统21输出的HE AAC v1编码音频数据和从子系统22输出的E AC-3 （DD+）编码音频数据以及与（例如，在本文中参考图1、图2和图3所描述的任何类型的）同步和控制比特进行时分复用，以根据本发明的实施方式来生成统一比特流。从块20输出的样本是根据一个或更多个感知模块（在块26中）来处理以确定应用于实施子系统21和子系统22中的处理的参数。

从块20输出的样本还在块25（标记为“共用比特池/统计复用器”）中被处理。这些样本是共享或共用比特池（在编码子系统21与编码子系统22之间共享的输入比特）。块25生成在编码子系统21与编码子系统 22之间有效地分配所共享的比特池中的可用比特的控制值（针对子系统 21和子系统22），以优选地优化统一比特流的总体音频质量（例如，取决于在块25中执行的对所共享的比特池的统计分析结果，使用编码子系统 21和编码子系统22之一来或多或少地对可用比特进行编码，并且使用编码器子系统21和编码子系统22中的另一个来对剩下的可用比特进行编码）。借助于块25，图5编码器优选地使用统一输出比特流的输入比特率和最大超帧长度、通过确定将多少比特的输入数据（由从编码子系统22 的时域-频域变换级输出的频域系数表示）赋给E AC-3编码频域系数的每个量化尾数以及将多少比特的输入数据（由从编码子系统21的“MDCT” （改进型离散余弦变换）级输出的频域系数）赋给从子系统21输出的量化HE AAC v1码字，来在两个编码子系统之间分配来自共享比特池的比特。相比于图5系统，常规E AC-3编码器可以包括被配置为进行以下处理的比特分配元件：以不依赖于考虑对将E AC-3编码数据复用成统一比特流的需要的方式来确定将多少比特的输入数据分配给（由E AC-3编码器生成的）E AC-3编码频域系数的每个量化尾数；并且常规HE AAC v1 编码器可以包括被配置为进行以下处理的比特分配元件：以不依赖于考虑对将HE AAC v1编码数据复用成统一比特流的需要的方式来确定将多少比特的输入数据分配给（由HE AAC v1编码器生成的）每个量化HE AAC v1码字。优选地，所输入的共享比特池的比特率和（所输出的组合比特流的）最大超帧长度已知，并且被用于优化在编码子系统21与编码子系统22之间执行的比特分配以（在块3中）生成经优化的组合输出比特流。

设置图5的延迟块24以自适应地延迟要被DD+编码子系统22的剩余部分编码的（从块20中输出的）样本。要被HE AAC编码子系统进行 HE AAC v1编码的（从块20中输出的）样本不被块24延迟。例如当要被（子系统21和子系统22）编码的输入比特指示复杂或困难的音频段和 /或场景时，为了减少（编码子系统21和编码子系统22）对来自共用池的比特的同步需要，块24可以将两个编码子系统解同步到N个音频样本和 /或块。在图5编码器的一些实施中（以及在本发明的编码器的一些其他实施方式中），共享比特池提供了一种用于确保（统一输出比特流的）数据帧的组表示固定数量的输入音频样本或特定数量的输入比特（以简化如比特流打包以及与视频复用等下游处理）的机制。

在本发明的编码器的一些实施方式（例如，将参考图6、图7和图8 描述的那些实施方式）中，解同步自适应延迟（例如，图6、图7和图8 的延迟块24）在一个编码路径上实施并且第二自适应延迟（例如，图6、图7和图8的延迟块101）也自适应地在另一个（补充）编码器路径内实施以校正由解同步延迟（其通常在比特分配与量化之前被应用）引入的定时偏移。在典型的实施方式中，编码器生成供系统打包器和复用器（例如， MPEG2或MPEG4复用器）使用的控制信号（其传送由自适应解同步延迟生成的当前定时偏移）。这为该系统（其包括或被耦合至本发明的编码器）提供了一种用于适当地对传送统一比特流的数据分组的传递进行调度的机制。

图6是本发明的编码器的实施方式（其是图5实施方式的变型）的示出了编码器的模块和由编码器执行的操作的图。编码音频比特流（例如， 5.1声道AC-3编码比特流）被设置为输入到图6编码器的PCM/输入信号调节块120。作为响应，块120输出表示6个声道的输入音频数据的PCM 音频样本。响应于该输入音频数据，图6编码器生成单一的统一比特流，并且在比特流打包与格式化块30的输出处设置统一流。

图6编码器除了在前段描述的以外与图5的编码器相同，并且相同之处在于：图6编码器的HE AAC编码子系统（其被配置成根据HE AAC v1 编码协议或另一种HE AAC编码协议版本对来自块120的一些或所有输入数据进行编码）包括对由解同步延迟块24（其在比特分配与量化级之前的段处的DD+编码子系统中被实施）引入的定时偏移进行校正的自适应延迟块101。图6编码器生成供系统打包器和复用器（例如，MPEG2 或MPEG4复用器）使用的控制信号（传送由自适应解同步延迟块24生成的当前定时偏移）。这为系统（包括或被耦合至编码器）提供了一种用于适当地对传送统一比特流的数据分组的传递进行调度的机制。

图7编码器除了图6的PCM/输入信号调节块120在图7编码器中被输入比特流解码器122替代以外，与图6的编码器相同。编码音频比特流（例如，5.1声道AC-3编码比特流）被设置为至图7编码器的解码器122 的输入。作为响应，解码器122输出表示6个声道的输入音频数据的PCM 音频样本。响应于该输入音频数据，图7编码器生成单一的统一比特流，并且在比特流分组和格式化块30的输出处设置统一比特流。

图8编码器除了以下方面以外与图7的编码器相同。编码音频比特流（例如，双声道HE AAC编码比特流）被设置为至图编码器的输入比特流解码器123的输入。作为响应，解码器123输出表示输入音频数据的两个声道的PCM音频样本。响应于该输入音频数据，图8编码器生成单一的统一比特流，并且在比特流打包与格式化块30的输出处设置统一比特流。图8的DD+编码子系统（其被配置成根据E AC-3编码协议来对一些或全部输入数据进行编码）包括初始上混合模块100，其可用于将来自块 123的双声道（立体声）输入数据上混合至5.1声道多声道音频数据以用于后续的处理（即，接在编码为E AC-E编码数据之前的自适应延迟块24 中的延迟）。由于图8的HE AAC编码子系统（由附图标记121标识）接收双声道输入音频，但是它不包括5:2下混合模块（如图5、图6和图7 中的每个的HE AAC编码子系统所包括的）。

在另一类实施方式中，本发明的编码器生成统一比特流，该统一比特流包括作为（DD+解码器将解码的）DD+编码数据流的独立子流而发送的 DD+数据（根据DD+协议来编码的数据）、和作为（DD+解码器将忽略的） DD+编码数据流的第二（独立或相关的）DD+子流而发送的HE-AAC数据（根据HE-AAC协议来编码的数据）。更一般地，在一类实施方式中，本发明的编码器生成包括两个或更多个独立子流的统一比特流（每个比特流包括根据不同编码协议来编码的数据）。例如，该子流能够在被称为 ATSC A/52B Annex E的公知标准中被定义。例如，统一比特流可以包括符合分别在ATSC A/52B Annex E、ATSC A/53和ETSI/DVB XXXX中定义的语法和解码器缓冲区约束的一个子流（“子流1”），并且统一比特流还可以包括另一个子流（“子流2”），该子流与符合在MPEG14496-3中定义的语法但是（在所执行的用于将该子流与子流1复用在该统一比特流中的交织/复用处理步骤）不直接支持在MPEG14493-3和ETSI XXXX 中定义的解码器缓冲区约束。该方法保持了对于子流1的与现有ATSC A/52B Annex E符合的解码器的直接兼容性（没有附加的处理步骤）但是需要在针对子流2的解码之前的中间处理步骤（例如，MPEG14496-3部分）。ATSC A/52B Annex E子流方法提供了针对未来增强（例如，声道计数>6，更高的最大比特率和对于听力或视觉修复的关联比特流等）的对于同一比特流的较大的可扩展性，但是是以不能与仅支持第一编码协议（而不支持第二编码协议）的常规解码器和仅支持第二编码协议（而不支持第一编码协议）的常规解码器两者兼容为代价。此外，上面参考图1、图2和图3所描述的实施方式具有最大组合比特率（比特流1+比特流2）限制，其是由在MPEG14496-3中定义的最大帧大小来确定。相比之下，生成包括（如在本段中描述的）子流的统一比特流的实施方式不受该最大组合比特率限制。

考虑生成包括（如在前一段落中描述的）多个子流的统一比特流的本发明的编码器的实施方式，该多个子流包括包含MPEG14496-3音频数据的子流。为了对MPEG14496-3数据（统一比特流的子流2）进行解码，必须在（由MPEG14496-3解码器进行的）解码之前采取的中间处理步骤包括：对来自统一（组合）比特流的可适用子流（示例中的子流2）进行分析和解复用；以及将经解复用（以及经分析）的数据字节重新组装成连续的MPEG14496-3适应的子流。

图4A是包括本发明的编码器（编码器90）和两个解码器（12和91）的实施方式的系统的框图，从解码器12和91中的每个能够对包括在由编码器90生成（输出）的比特流中的编码音频数据进行解码的意义上来将这两个解码器（12和91）与编码器90兼容。编码器90优先地为感知编码系统，并且被配置为生成包括根据第一编码协议编码的音频数据和根据第二编码协议编码的音频数据之一或两者的统一比特流。统一比特流包括两个或更多个子流，每个子流包括根据上述编码协议中的不同编码协议来编码的数据（例如，比特流包括根据DD+协议来编码并且作为DD+编码数据流的独立子流而发送的DD+数据、和根据HE-AAC协议编码并且作为DD+编码数据流的第二（独立或相关的）子流而发送的HE-AAC数据）。从解码器12被配置成识别和解码根据第一编码协议编码的（在统一比特流中的）音频数据的意义上来将，统一比特流可以由解码器12（在一些实施方式为常规解码器）来解码。工作中，统一比特流在解码器12的至少一个输入端处被接收，并且解码器12的解码子系统通过对根据第一编码协议编码了的音频数据（由统一比特流表示）进行识别和解码而忽略统一比特流中根据第二编码协议编码了的附加音频数据来进行操作。例如，当统一比特流包括DD+数据的独立子流，解码器12可以是被配置成对根据DD+协议编码了的音频进行解码的常规DD+解码器。从解码器91根据本发明的实施方式被配置成对统一比特流的子流之一（根据第二编码协议来编码的子流）进行解析和解复用以及将解复用数据组成连续数据流（根据第二编码协议来编码）的意义上来讲，统一比特流还可由解码器91（其不是常规解码器）来解码。这些操作都是由解码器91的子系统93来执行的。解码器91的解码子系统94被耦合至子系统93的输出端，并且被配置成对从子系统93输出的连续编码数据流进行解码。例如，当第二编码协议是HE-AAC协议（例如，立体声HE AAC v1或HE AAC v2）并且统一比特流包括根据HE-AAC协议编码并且作为DD+编码数据流的（独立或相关的）子流发送的HE-AAC数据的第二（独立或相关的）子流时，子系统93对来自统一比特流的第二子流进行解析和解复用以及将解复用数据组成连续的HEAAC数据流，并且子系统94（根据HE-AAC解码协议）对从子系统93输出的连续的HE-AAC数据流进行解码。

本文所描述的用于创建统一比特流的方法及系统优选地提供用信号清楚地通知（解码器）在统一比特流中利用哪种交织方法的能力（例如，用信号通知使用了图1、图2和图3的AUX、SKIP/DSE方法还是使用了在前两段中描述的E AC-3子流方法）。一种这样的做的方法是在统一比特流中包括对用于生成该统一比特流的交织方法进行标识的新的（使用 AC-3或E AC-3帧的BSI（比特流信息）字段来传送的类型的）BSID（比特流标识）值。

感知音频编码器生成可单独解码并且表示特定时间间隔（表示固定数量的音频样本）的压缩（速率减小了的）信息的“帧”。因此，不同的音频编码系统通常生成表示与该编码系统自身的时域-频域变换子功能（例如，MDCT等）内所支持的音频块（包括特定数量个音频样本）的数量直接有关的唯一时间间隔的“帧”。通过对来自若干不同编码系统的两个或更多个比特流进行组合，在进行可能在媒体发布系统中遇到的任何类型比特流处理的情况下，出现复杂化。这包括比特流拼接操作，其中“拼接” 必须出现在“帧”边界处。否则，部分或片断的压缩数据帧会被创建并且下游解码器会易于在它们的输出端产生不利的“可听的”效果并且/或会出现同步滑动/定时偏移（影响嘴唇同步）。由本发明的典型实施方式实施的统一编码系统和统一输出比特流将来自具有不同“成帧”的两个不同音频编码系统的比特流（比特流1和比特流2）交织（复用）到包括来自比特流1和比特流2的整数帧的单个“超帧”，从而表示相同的时间间隔。超帧边界处的拼接和/或切换不会根据基础的比特流（即，比特流1和比特流2）来生成部分和/或片断帧。

在另一类实施方式中，本发明被实施为转码器（或实施在转码器内）。例如，本发明的实施方式是被配置成生成统一输出比特流的转码器，该统一输出比特流包括根据不同协议编码的两个数据流（例如，上述比特流1 和比特流2）但是源自仅根据上述协议之一编码的数据（例如，仅比特流 1，使得比特流1是转码器输入端处唯一可用的流）。转码器被配置并且可用于对输入比特流1进行解码（并且下混合，如果适用）以生成被重新编码为比特流2的解码器数据。原始比特流1然后与新创建的比特流“2” 进行交织以完成设置在转码器输出端的统一比特流。再例如，本发明的实施方式是如在前一示例中定义的转码器，但是其中单一输出比特流是比特流2（比特流2是源）并且其中转码器被配置成根据比特流2通过解码操作（如适用则还包括上混合操作）来生成比特流1，然后将比特流1和比特流2组合成统一比特流。再例如，本发明的实施方式是可用于对（根据第三编码格式来编码的）输入比特流3进行解码（如果适用，则还包括上混合或下混合）以生成被重新编码为（第一编码格式的）比特流1和（第二编码格式的）比特流2两者的解码数据。重新编码的比特流1和比特流 2然后被交织以完成设置在转码器输出端处的统一比特流的生成。

在另一类实施方式中，本发明是一种用于对由编码器生成的统一比特流进行解码的方法，其中该统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且统一比特流可由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码，所述方法包括步骤：

（a）将统一比特流提供给被配置成对根据第一编码协议编码了的音频数据进行解码的解码器；以及

（b）使用该解码器对该统一比特流进行解码，包括通过对第一编码音频数据进行解码而忽略附加编码音频数据。

在一些实施方式中，第一编码协议是多声道Dolby Digital Plus协议，第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在该类中的其他实施方式中，第二编码协议是多声道 Dolby Digital Plus协议，第一编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。步骤（b）可以包括对统一比特流中表示一组后续的比特应该被忽略而非被解码的比特进行识别的步骤。

在另一类实施方式中，本发明是一种解码器，其被配置成对由编码器生成的统一比特流进行解码，其中统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且统一比特流可由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码。该解码器包括被配置成接收统一比特流的至少一个输入端；和耦合至所述至少一个输入端并且被配置成对根据第一编码协议编码了的音频数据进行解码的解码子系统，其中解码子系统被配置成对统一比特流中的第一编码音频数据进行解码而忽略统一比特流中的附加编码音频数据。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital Plus协议。在该类中的其他实施方式中，第一编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。解码子系统可以被配置成对统一比特流中表示一组后续比特应该被忽略而非被解码的比特进行识别。

图9是输出统一比特流的本发明编码器（编码器200）的实施方式的图。图9示出了可向其提供统一比特流的系统及设备的示例，包括地面网络、线缆网络、电话网络、无线网络或IP网络，其将统一比特流发送至被配置成对根据第二编码协议编码了的比特流的数据进行解码和呈现，并且将该比特流（例如，通过HDMI链路）设置至被配置成对根据第一编码协议编码了的统一比特流的数据进行解码和呈现的其他处理设备的各种处理设备中的任意设备。上述网络（地面网络、线缆网络、电话网络、无线网络或IP网络）还将统一比特流发送至处理系统（例如，包括被配置成对根据第一编码协议编码了的比特流的数据进行解码和呈现的设备），其然后将该比特流（例如，通过经由有线或无线IP网络来流处理该比特流）重新设置至配置成对根据第二编码协议编码的统一比特流的数据进行解码和呈现的处理设备中。

因此，本发明音频编码方法的一些实施方式包括生成单一、统一比特流的步骤，该比特流可由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器来进行解码，其中统一比特流包括根据第一编码协议和第二编码协议编码了的编码数据的超帧，使得多媒体或数据流处理服务器（例如，图9中标记为“无线IP网络（流处理）”的网络的服务器）能够支持统一比特流的流处理和/或传输，其中所述多媒体或数据流处理服务器仅支持第一编码协议和第二编码协议之一。

因此，本发明的实施方式是一种系统，包括：

音频编码器（例如，图9的编码器200），其被配置成生成单一统一比特流，该比特流可由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器进行解码，其中该统一比特流包括根据第一编码协议和第二编码协议编码的编码数据的超帧；以及

服务器（例如，在图9中具有标记“无线IP网络（流处理）”的网络的服务器），其被耦合为接收统一比特流并且被配置成将该统一比特流流处理至被配置成对该统一比特流的数据进行解码和呈现的至少一个处理设备中，其中所述服务器仅支持第一编码协议和第二编码协议之一。

在一些实施方式中，本发明系统是或包括通用处理器，该通用处理器被耦合成接收或生成表示X声道音频输入信号的输入数据（或表示要根据第一编码协议编码的第一X声道音频输入信号和要根据第二编码协议编码的第二Y声道音频输入信号的输入数据）并且被使用软件（或固件）编程和/或（响应于控制数据）被以其他方式配置成对输入数据执行包括本发明方法的实施方式的各种操作中任意操作以生成表示单一的统一编码比特流的数据。这样的通用处理器通常会被耦合至输入设备（例如，鼠标和/或键盘）、存储器和显示设备。例如，图4的编码器10可以实施在通用处理器中，DATA1是表示要根据第一编码协议编码的X个声道的音频数据的输入数据，而DATA2是表示要根据第二编码协议编码的Y个声道的音频数据的输入数据，并且由编码器10设置（至解码器12或14）的单一的统一比特流是通过响应于输入数据（根据本发明的实施方式）而生成的输出数据来确定的。再例如，参考图5描述的编码器可以在通用处理器中实施，PCM样本（被设置至块20的输入端）是表示6个声道的音频数据的输入数据，并且在打包与格式化块30的输出端设置的统一比特流是通过响应于输入数据（根据本发明的实施方式）而生成的输出数据来确定的。

在一些实施方式中，本发明是被配置成对由编码器生成的统一比特流进行解码的解码器（例如，如在图9中所示的接收由编码器200生成的统一比特流的那些解码器中任意解码器，或图4A的解码器91），其中统一比特流包括至少两个子流，所述子流包括根据第一编码协议编码的数据的第一独立子流和根据第二编码协议编码的数据的第二子流，其中所述解码器包括：

第一子系统，其被配置成对来自统一比特流的第二子流进行解析和解复用，以确定解复用数据，并且将解复用数据组成根据第二编码协议编码的连续数据流；以及

解码子系统，其被耦合至第一子系统，并且被配置成对连续数据流进行解码。

在一些情况下，第一编码协议是DD+协议，并且第一独立子流和第二子流是DD+编码数据流的子流。在一些情况下，第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。

在一些实施方式中，本发明是一种用于对由编码器生成的统一比特流进行解码的方法，其中统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且该统一比特流可由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码，所述方法包括步骤：

（a）将统一比特流提供给被配置成对根据第一编码协议编码了的音频数据进行解码的解码器；以及

（b）使用该解码器对该统一比特流进行解码，包括通过对第一编码音频数据进行解码而忽略附加编码音频数据。

在一些情况下，第一编码协议是多声道Dolby Digital Plus协议。第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些情况下，第二编码协议是多声道Dolby Digital Plus协议，第一编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。可选地，步骤（b）包括对统一比特流中表示一组后续比特应该被忽略而非被解码的比特进行识别的步骤。

在一些实施方式中，本发明是被配置成对由编码器生成的统一比特流进行解码的解码器（例如，在图9中被示出为接收由编码器200生成的统一比特流的那些解码器中的任意解码器），其中统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且该统一比特流可由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码，所述解码器包括：

被配置成接收统一比特流的至少一个输入端；以及

解码子系统，其被耦合至所述至少一个输入端，并且被配置成对根据第一编码协议编码了的音频数据进行编码的音频数据进行解码，其中解码子系统被配置成对统一比特流中的第一编码音频数据进行解码而忽略统一比特流中的附加编码音频数据。

在一些情况下，第一编码协议是多声道Dolby Digital Plus协议。在其他情况下，第一编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。可选地，解码子系统被配置成对统一比特流中表示一组后续比特应该被忽略而非被解码的比特进行识别。

在一些实施方式中，本发明是被配置成生成单一的统一比特流的音频编码系统，该比特流可由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器来进行解码。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital Plus协议，而第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital协议，而第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital Plus协议，而第二编码协议是多声道Dolby Digital Plus协议、立体声AAC 协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些这样的实施方式中，第一编码协议是单声道Dolby Digital协议和立体声 Dolby Digital协议之一，而第二编码协议是多声道Dolby Digital Plus协议。在一些这样的实施方式中，第一编码协议是单声道Dolby Digital协议和立体声Dolby Digital协议之一，而第二编码协议是多声道AAC协议和多声道HE AAC v1协议之一。

在一些实施方式中，本发明是一种音频编码方法，其包括步骤：生成可由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器来进行解码的单一的统一比特流。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital Plus协议，而第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital协议，而第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2 协议之一。在一些这样的实施方式中，第一编码协议是多声道Dolby Digital协议，而第二编码协议是多声道Dolby Digital Plus协议、立体声 AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一。在一些这样的实施方式中，第一编码协议是单声道Dolby Digital协议和立体声Dolby Digital协议之一，而第二编码协议是多声道Dolby Digital Plus 协议。在一些这样的实施方式中，第一编码协议是单声道Dolby Digital 协议和立体声Dolby Digital协议之一，而第二编码协议是多声道AAC协议和多声道HE AAC v1协议之一。

在一些实施方式中，本发明是一种解码器，其被配置成对由编码器生成的统一比特流进行解码，其中统一比特流包括至少两个子流，所述子流包括根据第一编码协议编码的数据的第一独立子流和根据第二编码协议编码的数据的第二子流，其中所述解码器包括：

第一子系统，其被配置成对来自统一比特流的第二子流进行解析和解复用从而确定解复用数据，并且将解复用数据组成根据第二编码协议来编码的连续数据流；以及

解码系统，其被耦合至第一子系统并且被配置成对连续数据流进行解码。

在一些这样的实施方式中：第一子系统被配置成将解复用数据组成根据第二编码协议编码的所述连续数据流和根据第一编码协议编码的第二数据流，并且解码器（例如，该解码器的第一子系统）被配置成通过有线和无线网络连接的至少之一来将第二数据流转发给二级设备，其中该二级设备支持对根据第一编码协议编码的数据进行解码而不支持对根据第二编码协议编码的数据进行解码；或

第一编码协议是Dolby Digital Plus协议，并且第一独立流和第二子流是Dolby Digital Plus编码数据流的子流；或

第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一；或

第二编码协议是Dolby Digital协议，并且第一独立子流和第二子流是Dolby Digital Plus编码数据流的子流；或

第一编码协议是AAC协议、HE AAC v1协议和HE AAC v2协议之一；或

第二编码协议是Dolby Digital协议和Dolby Digital Plus协议之一；或

第一编码协议是Dolby Digital协议和Dolby Digital Plus协议之一；或

第二编码协议是MPEG空间音频对象编码（SAOC）协议（或另一种面向对象协议）；或

第一编码协议是MPEG SAOC协议（或另一种面向对象协议）。

在一些实施方式中，本发明是用于对由编码器生成的统一比特流进行解码的方法，其中统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且统一比特流可由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器、和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码，所述方法包括步骤：

（a）向被配置成对根据第一编码协议编码了的音频数据进行解码的解码器提供统一比特流；以及

（b）使用解码器来对统一比特流进行解码，包括通过对第一编码音频数据进行解码而忽略附加编码音频数据。

在一些这种实施方式中：

第一编码协议是多声道Dolby Digital Plus协议，而第二编码协议是立体声ACC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一；或者

第二编码协议是多声道Dolby Digital Plus协议，而第一编码协议是立体声ACC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一；或

第一编码协议是Dolby Digital协议和Dolby Digital Plus协议之一；或

第二编码协议是立体声ACC协议、立体声HE AAC v1协议和立体声AAC v2协议之一；或

第一编码协议是AAC协议、HE ACC v1协议和HE AAC v2协议之一；或

第二编码协议是Dolby Digital和Dolby Digital Plus协议之一；

第二编码协议是MPEG SAOC协议（或另一个面向对象的协议）；或

第一编码协议是MPEG SAOC协议（或另一个面向对象的协议）。

在一些实施方式中，本发明是一种解码器，其被配置成对由编码器生成的统一比特流进行解码，其中统一比特流表示根据第一编码协议编码了的第一编码音频数据和根据第二编码协议编码了的附加编码音频数据，并且统一比特流可以由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来解码，所述解码器包括：

至少一个输入端，其被配置成接收统一比特流；以及

解码子系统，其被耦合至所述至少一个输入端，并且被配置成对根据第一编码协议编码了的音频数据进行解码，其中所述解码系统被配置成对统一比特流中的第一编码音频数据进行解码而忽略统一比特流中的附加编码音频数据。

在一些这样的实施方式中：

第一编码协议是多声道Dolby Digital Plus协议；或

第一编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一；或

第二编码协议是立体声AAC协议、立体声HE AAC v1协议和立体声HE AAC v2协议之一；或

第一编码协议是AAC协议、HE AAC v1协议和HE AAC v2协议之一；或

第二编码协议是Dolby Digital协议和Dolby Digital Plus协议之一；或

第一编码协议是Dolby Digital协议和Dolby Digital Plus协议之一；或

第二编码协议是MPEG SAOC协议（或另一个面向对象的协议）。或

第一编码协议是MPEG SAOC协议（或另一个面向对象的协议）。

在一些实施方式中，本发明是一种音频编码方法，其包括步骤：生成可以由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器和由被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来进行解码的单一的统一比特流，其中，统一比特流包括根据两个或更多个编码协议来编码的编码数据的超帧。

在一些实施方式中，本发明是一种音频编码方法，其包括步骤：生成可以由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来解码的单一的统一比特流，并且其中生成统一比特流的步骤支持解交织以生成包括根据第一编码协议编码的音频数据的第一比特流和包括根据第二编码协议编码的音频数据的第二比特流。

在一些实施方式中，本发明是一种音频编码方法，其包括步骤：生成可以由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器来解码的单一的统一比特流，其中统一比特流包括根据第一编码协议和第二编码协议编码的编码数据的超帧，使得多媒体或数据流处理服务器能够支持统一比特流的流处理和传送的至少之一，其中所述多媒体或数据流处理服务器仅支持第一编码协议和第二编码协议之一。

在一些实施方式中，本发明是一种系统，包括：

音频编码器，其被配置成生成单一的统一比特流，该单一的统一比特流可以由被配置成对根据第一编码协议编码了的音频数据进行解码的第一解码器和被配置成对根据第二编码协议编码了的音频数据进行解码的第二解码器来解码，其中统一比特流包括根据第一编码协议和第二编码协议编码的编码数据的超帧；以及

服务器，其被耦合以接收统一比特流并且被配置成将统一比特流流处理至被配置成对统一比特流的数据进行解码和呈现的至少一个处理设备，其中所述服务器仅支持第一编码协议和第二编码协议之一。

在一些实施方式中，本发明是一种系统，包括：

音频编码器，其被配置成生成单一的统一比特流，该比特流可以由被配置成对根据第一编码协议编码的音频数据进行解码的第一解码器和被配置成对根据第二编码协议编码的音频数据进行解码的第二解码器来解码，其中所述统一比特流包括根据第一编码协议和第二编码协议编码的编码数据的超帧；以及

服务器，其被耦合以接收统一比特流并且被配置成将以下之一流处理到至少一个处理设备：根据第一编码协议编码的比特流的帧、和根据第二编码协议编码的比特流的帧，其中所述服务器仅支持第一编码协议和第二编码协议之一。

虽然在本文中描述了本发明的具体实施方式和本发明的应用，但是对于本领域普通技术人员很明显的是，在不偏离本文所描述及要求保护的范围的情况下，可以有关于实施方式和应用的许多变型。应当理解，虽然示出及描述了本发明的特定形式，本发明不限于所描述及示出的具体实施方式或所描述的特定方法。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统 [P] . 中国专利： CN103460288B . 2015.08.19
2. 用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法及系统 [P] . 中国专利： CN103460288A . 2013-12-18
3. Audio encoding method and system for generating a unified bitstream decodable by decoders implementing different decoding protocols [P] . 美国专利： US9378743B2 . 2016-06-28

机译：用于生成可由实施不同解码协议的解码器解码的统一比特流的音频编码方法和系统
4. AUDIO ENCODING METHOD AND SYSTEM FOR GENERATING A UNIFIED BITSTREAM DECODABLE BY DECODERS IMPLEMENTING DIFFERENT DECODING PROTOCOLS [P] . 欧洲知识产权局专利： EP2695162B1 . 2018-08-22

机译：用于生成通过实施不同编码协议的解码器可解码的统一比特流的音频编码方法和系统
5. AUDIO ENCODING METHOD AND SYSTEM FOR GENERATING A UNIFIED BITSTREAM DECODABLE BY DECODERS IMPLEMENTING DIFFERENT DECODING PROTOCOLS [P] . 美国专利： US2014358554A1 . 2014-12-04

机译：用于生成通过实施不同编码协议的解码器可解码的统一比特流的音频编码方法和系统