首页> 中国专利> 确定数据帧是否包含已编码附加数据的方法和设备

确定数据帧是否包含已编码附加数据的方法和设备

摘要

将mp3标准比特流格式化为固定长度的数据帧序列。这些数据帧序列包括报头、边信息、主信息和表示为“辅助数据”的不具有通常定义信息的剩余数据字段。该mp3PRO格式是mp3格式的扩展,其中在辅助数据字段中传送附加mp3PRO数据。在多种应用中,例如在因特网音乐搜索机中,出现了快速确定比特流类型的需要。通常,使用mp3PRO解码器来执行这样的确定。但是,由于帧报头中不包含指向辅助数据字段的启始地址的相应指针,因此mp3PRO解码器首先必须根据mp3标准完全对至少一个数据帧进行解码,以便找到mp3数据的结束地址,并由此找到该数据帧中的mp3PRO数据的随后的启始地址。之后,mp3PRO解码器必须针对mp3PRO附加信息的典型特征来检查在该数据流中随后的数据。本发明公开了如何确定比特流类型,而无需使用mp3解码和mp3PRO解码器。

著录项

  • 公开/公告号CN1589468A

    专利类型发明专利

  • 公开/公告日2005-03-02

    原文格式PDF

  • 申请/专利权人 汤姆森许可贸易公司;

    申请/专利号CN02822773.5

  • 发明设计人 恩斯特·F·施罗德;

    申请日2002-11-02

  • 分类号G10L19/14;

  • 代理机构中科专利商标代理有限责任公司;

  • 代理人戎志敏

  • 地址 法国布洛里

  • 入库时间 2023-12-17 15:55:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-15

    未缴年费专利权终止 IPC(主分类):G10L19/14 授权公告日:20070207 终止日期:20161102 申请日:20021102

    专利权的终止

  • 2007-02-07

    授权

    授权

  • 2005-05-04

    实质审查的生效

    实质审查的生效

  • 2005-03-02

    公开

    公开

说明书

技术领域

本发明涉及一种用于确定作为比特流的一部分的数据帧,除了诸如mp3数据的已编码标准数据之外,是否包含诸如mp3PRO数据的已编码附加数据的方法和设备。

背景技术

对于音频编码、传输和解码,特别是对于因特网应用,例如,将音频编码标准ISO/IEC 11172-3,层III、ISO/IEC 13818-3,层III(MPEG音频层III)以及ISO/IEC 13818-7用于数据缩减。对于这种类型的编码/传输/解码,一种广泛使用的缩写是“mp3”。

这些及其它公知的音频编码标准的共同特点是将已编码的数据格式化为固定长度的数据帧序列,以便将其作为数据流传送或作为数据文件存储。每一帧包含一段原始音频信号的一定时间长度(例如24毫秒)的数据。该数据帧包括报头、具有特别重要信息(边信息(sideinformation))的数据字段、具有强烈可变信息(主信息)的数据字段、以及在许多情况下不具有通常定义信息的剩余数据字段。在ISO/IEC标准中没有具体定义不具有通常定义信息的剩余数据字段,将其表示为“辅助数据”,并且可以出于多种目的自由地使用。

数据帧中包含不具有特定信息的数据字段的原因是针对数据帧初始编码的信息量非常强地根据原始音频信号的当前特性而变化,并且-尽管编码器控制主要目的在于每一个数据帧输出恒定的数据率-但针对数据帧初始编码的信息量决不会包含与固定长度的数据帧精确对应的最终编码的数据量。换句话说,编码器的任务之一是控制编码,从而使编码的数据刚好以给定的总数据率(由此,数据帧的绝对比特长度)适应于所述帧。通常,通过适配编码质量,例如量化的粗糙等级来设法实现该目标。但是,通过这些方式,不能只命令编码器持续地设法填充而不使数据帧过载,而还可以命令编码器持续地针对“辅助数据”,保持每一数据帧至少一定的数据量。

图1示出了具有多个帧n…n+3的mp3数据流的典型结构。每一个帧以报头和边信息字段开始。例如,边信息是抽样频率、比例因子、量化信息和立体声/单声道信息。主信息字段1到4包含已编码的音频信号系数。边信息字段还可以包括指针“main_data_begin”,声明了主信息字段的相应第一比特的地址。还示出了“辅助数据”字段的位置,如果存在的话,紧随在主信息字段之后。

图3示出了提供了根据图1的比特流的音频编码器的基本结构。将输入音频抽样提供给编码器。映射和滤波器组级MFB创建原始输入信号的滤波及再抽样后的短期频域表示,即变换后的子带抽样或系数。将心理声学模型级PAMC用于计算数据集合(例如信号与掩码比),以控制比特分配器/量化器和编码器级BAQC。比特流格式化器BF从其它模块的输出数据中装配实际的比特流,添加其它信息(例如纠错),并形成恒定长度的数据帧。

近年来,THOMSON multimedia and Coding Technologies公司提出了作为mp3格式的扩展的“mp3PRO”格式。将所需的附加mp3PRO数据作为相应数据帧字段中的“辅助数据”传送。已编码的mp3PRO比特流与已编码的mp3比特流兼容,从而较早的mp3播放器或解码器能够不使用“辅助数据”,容易地解码并再现mp3PRO比特流或文件。

发明内容

由于特定的mp3PRO数据被作为“辅助数据”传送,因此乍一看,比特流未被检测为mp3PRO比特流,而被检测为mp3比特流。但是,在多种应用中,例如在因特网音乐搜索机中,出现了快速确定比特流类型的需要。通常使用mp3PRO解码器来执行这种确定。由于将附加信息存储于辅助数据字段中,并且由于帧报头不包含指向辅助数据字段的启始位置的相应指针,因此mp3PRO解码器首先必须根据mp3标准完全地对至少一个数据帧进行解码,以便发现mp3数据的结束地址,从而发现该数据帧中的mp3PRO数据的随后的启始地址。

之后,mp3PRO解码器必须针对对于mp3PRO附加(补充)信息而言较典型的特性来检查在数据流中随后的数据。所述的后一个步骤,特别是以上提到的mp3解码需要相当大的计算负担。另一方面在于初始的mp3专用的解码步骤不受欢迎,例如,出于许可证的原因。

这具有以下缺点:需要检查相对大的数据区域,并且在该区域内,通过mp3音频数据可能意外地产生mp3PRO专用模式。这会造成大量的错误检测,结果将会增大所需的计算能力。

根据本发明,通过利用可容易获得的其它信息来限制搜索区域,可以减少这些缺点。针对mp3PRO扩展的特征,例如针对报头的特定类型或针对特定的同步字,直接并且自动地搜索(不需要用户交互)未知的mp3或mp3PRO比特流,无需执行部分mp3解码且无需使用mp3PRO解码器,以便确定当前比特流是mp3还是mp3PRO类型。

通过逐位地搜索数据帧的完整数据,能够校验一定数据模式的存在。

由于mp3PRO附加数据是字节对准,因此还可以将该搜索限定于完整的字节边界上和按字节递增的步骤上。

有利的是,通过可选地或附加地自动检查既不是报头也不是同步字的另外的候选数据模式是否与mp3PRO专用的CRC(循环冗余校验)码匹配,可以执行mp3PRO附加(补充)信号中对特定数据模式的搜索。

本发明所要解决的问题是确定当前的比特流是mp3还是mp3PRO类型,由此,既不使用mp3的典型解码步骤也不使用mp3PRO解码器。通过权利要求1公开的方法解决了该问题。权利要求8公开了使用该方法的设备。

原则上,本发明的方法适合于确定作为比特流的一部分的数据帧,除了诸如mp3数据的已编码标准数据之外,是否还包含诸如mp3PRO数据的已编码附加数据,

其中,所述标准数据包括在所述数据帧的相应数据字段中的报头数据、边信息数据和主信息数据,并且可以包括辅助数据字段,其中,如果存在的话,所述附加数据设置于所述辅助数据字段内的数据字段中,且包括特定差错保护数据以及由所述特定差错保护数据保护的特定主信息数据,和/或包括特定标识数据,例如特定报头或特定同步数据,

其中,在所述比特流中没有设置用于直接确定所述附加数据字段开始或结束的地址值,而将在对所述标准数据解码之后确定所述附加数据字段的开始或结束,

其中,所述边信息数据可以包括指向主信息数据字段的一个边界的地址信息,

其中,所述辅助数据字段与所述主信息数据字段边界相邻,但所述附加数据字段不必完全占用所述辅助数据字段,且当所述附加数据字段没有完全占用所述辅助数据字段的情况下,所述附加数据字段与所述主信息数据字段边界不相邻,

所述方法包括步骤:

a)获得至少当前数据帧的数据;

b)在所述当前数据帧中搜索:

b1)与所述特定标识数据相匹配的一个或多个标识数据,或

b2)当对其执行预定差错保护方案时,与所述特定差错保护数据相匹配的数据,或

b3)符合b1)的项,以及如果成功,符合b2)的项;

c)如果对于所述数据帧找到了符合b1)或符合b2)的匹配或符合b3)的双重匹配,则确定所述比特流包含所述已编码的附加数据,或者

如果对于所述数据帧没有找到符合b1)或符合b2)的匹配或者符合b3)的双重匹配,则确定所述比特流不包含所述已编码的附加数据。

原则上,本发明的设备适合于确定作为比特流的一部分的数据帧,除了诸如mp3数据的已编码标准数据之外,是否包含诸如mp3PRO数据的已编码附加数据,其中所述标准数据包括在所述数据帧的相应数据字段中的报头数据、边信息数据以及主信息数据,并且可以包括辅助数据字段,

其中,如果存在的话,则将所述附加数据设置于所述辅助数据字段中的数据字段中,且所述附加数据包括特定差错保护数据以及由所述特定差错保护数据保护的特定主信息数据,和/或包括特定标识数据,例如特定报头或特定同步数据,

其中,在所述比特流中没有设置用于直接确定所述附加数据字段开始或结束的地址值,而是将在对所述标准数据解码之后确定所述附加数据字段的开始或结束,

其中,所述边信息数据可以包括指向主信息数据字段的一个边界的地址信息,

以及其中,所述辅助数据字段与所述主信息数据字段的边界相邻,但所述附加数据字段不必完全占用所述辅助数据字段,且在所述附加数据字段未完全占用所述辅助数据字段的情况下,所述附加数据字段与所述主信息数据字段边界不相邻,

所述设备包括:

a)获取装置,用于获取至少当前数据帧的数据;

b)搜索装置,用于在所述当前数据帧中搜索:

b1)与所述特定标识数据相匹配的一个或多个标识数据,或

b2)当对其执行预定差错保护方案时,与所述特定差错保护数据相匹配的数据,或者

b3)符合b1)的项,以及如果成功,符合b2)的项;

c)评估装置,用于评估比较结果,如果对于所述数据帧已发现了符合b1)或符合b2)的匹配或者符合b3)的双重匹配,则确定所述比特流包含所述已编码的附加数据,或者

如果对于所述数据帧未发现符合b1)或符合b2)的匹配或者符合b3)的双重匹配,则确定所述比特流不包含所述已编码的附加数据。

在各个从属权利要求中公开了本发明的优选的另外实施例。

附图说明

参考附图,对本发明的典型实施例进行说明,其中示出了:

图1 mp3比特流的几个数据帧;

图2在图1的辅助数据字段中传送的附加mp3PRO数据的基本数据结构;

图3已知的mp3音频编码器的基本框图;

图4用于已知的mp3编码和解码过程的基本流程图;

图5已知的mp3音频解码器的基本框图;

图6用于本发明mp3/mp3PRO检测器的框图。

具体实施方式

图2示出了用于mp3PRO比特流的附加信息的基本结构,此附加信息位于图1所示mp3比特流的“辅助数据”字段中。特定mp3PRO报头或者单个或多个不相同的标识模式ADH之后跟随着长度信息数据字段LI、特定mp3PRO CRC校验字ADCRC、具有CRC保护数据的数据字段CRCD、以及具有无CRC保护数据的数据字段NCRCD。由ADCRC字来保护CRCD数据。LI包含长度信息或指向NCRCD数据字段的结束的地址指针。CRCD和/或NCRCD数据用于补充对mp3编码/解码音频信号的编码/解码,由此增强音频信号的总体质量。CRCD数据包含重要信息,且NCRCD数据包含用于恢复mp3PRO的特定信息的较不重要的信息。

这种分层编码和解码的优点在于:现有的mp3解码器能够容易地接收并处理mp3PRO比特流和数据帧,而不会受到mp3PRO特定数据的干扰。因此,mp3解码器不检测mp3和mp3PRO数据流之间的差别。通过这些措施,mp3PRO与mp3后向兼容。

为了可靠地确定mp3PRO比特流,mp3PRO解码器只评估几个数据帧基本上就足够了,这是因为mp3PRO解码器的主要特点在于其结构刚好适合于该确定处理。

在ISO/IEC 11172-3和ISO/IEC 13818-3的数据流中,通常不知道“辅助数据”字段的确切启始位置。如上所述,通过对帧数据进行mp3解码,能够找到该数据字段的启始地址。

此外,在层3/mp3编码中,“辅助数据”字段的结束地址未被直接指示,而是按照依赖于信号的方式变化。但是,与随后数据帧的可变数据的开始相一致的相应结束地址由表示为main_data_begin的指针指示,并且设置于随后数据帧的报头中。由于通过部分地评估该数据帧的主信息可以找到此指针,因此通常不仅需要解码当前数据帧,还需要评估随后数据帧的报头,以便确定mp3PRO数据的存在。

为了理解根据本发明哪些mp3解码步骤不需要用于确定mp3PRO数据的存在,图4示出了通常所需的当前技术水平的mp3解码步骤,而图5示出了相应mp3音频解码器的基本结构。

将比特流数据提供给图5的解码器。在帧拆包器和用于执行差错检测的解码模块FUP中对该比特流数据进行拆包,并恢复包括所需边信息在内的多个信息。反量化和重构电路IQR重构映射抽样集合的量化形式。反映射器IM将已映射的抽样变换回统一的PCM抽样。mp3PRO格式需要附加的解码级。

在图4中,根据本发明,可以省略从“解码比例因子”到“输出PCM抽样”步骤、以及特定的mp3PRO解码步骤(未示出)。

本发明用于确定mp3PRO数据存在的过程如下:

-获得至少一个当前mp3或mp3PRO数据帧的数据;

-从随后的帧中获得报头数据,至少直到检索到指针main_data_begin为止;

-逐比特地在当前数据帧中搜索一个或多个候选mp3PRO标识模式(报头或同步),直到到达main_data_begin地址为止,这样的模式可以偶然地出现在mp3数据流中;

-在找到候选的mp3PRO标识模式之后,对跟随在该候选mp3PRO标识模式之后的数据和长度信息字段LI进行CRC校验,

-将CRC校验结果与CRC字ADCRC进行比较;

-如果两者匹配(且未出现传输差错),则将该候选mp3PRO标识模式看作正确的mp3PRO标识模式,并且将该数据流看作mp3PRO数据流:

-如果两者不匹配,则在一定时间段内继续如上所述搜索下一个出现的候选MP3PRO标识模式;

-如果在该时间段之内未找到这样的候选mp3PRO标识模式,则确定不存在mp3PRO数据流。

图6示出了相应的mp3PRO数据检测器。将比特流输入数据IP提供给时钟恢复和数据帧分割器级CRFS。该级还可以执行纠错,并将所需的帧数据提供给数据标识符比较器MPPHSC,该数据标识符比较器MPPHSC将存储于标识符存储器MPPHSR中的相应标识符数据与数据帧中所接收到的数据部分进行比较。具体地,MPPHSR可以存储mp3PRO报头或同步数据。具体地,MPPHSC可以将所存储的mp3PRO报头或同步数据与所接收到的报头或同步数据进行比较。

CRFS级将所需的数据帧数据还提供给CRC计算器MPPCRCCA,所述CRC计算器计算针对所提供的数据的相应CRC校验字。在MPPCRCCP中,将所计算出的CRC校验字与存储于CRC数据存储器MPPCRCR中的校验字进行比较。具体地,MPPCRCR可以存储mp3PRO CRC数据(来自ADCRC字段)。结果级RS接收MPPHSC和MPPCRCCP的输出信号,并提供最终的检测信号MPPDS,特别是mp3PRO数据检测信号。由用于控制诸如搜索步长和搜索方向的控制器CTRL来控制CRFS、MPPHSC、MPPCRCCA、MPPCRCCR、MPPCRCCP和RS。

可以对上述过程作如下修改:

a)由于mp3PRO数据是字节对准的,仅以字节步进地搜索。

b)由于MPEG报头具有已知的长度,并由于即使在“零”音频信息的情况下,辅助数据的字段也不会在数据帧的启始处直接开始,因此,不直接在数据帧的启始处开始搜索。较小程度的帧数据的初始解析可以有助于确定与对数据帧的整个音频数据进行完全解码相比,哪些步骤明显需要较少的努力。这样的步骤可以是:

-确定main_data_begin指针的位置,该指针在mp3中紧随在固定长度报头数据之后;

-确定“边信息”数据字段的长度,在mp3中取决于:

--单声道或双声道格式;

--MPEG-1(ISO/IEC 11172-3)或MPEG-2(ISO/IEC 13818-3)。

在报头数据中可以找到这两个信息项。

c)在到达作为针对随后的数据帧的“main_data_begin”的、从随后的报头开始的指针标识的数据字段的情况下,停止搜索。

d)从地址“main_data_begin”比特开始,按照相反随后的报头启始处之前的比特。

e)从地址“main_data_begin+nmin”比特开始,按照相反方向执行搜索随后的报头启始处之前的比特。因此,考虑附加mp3PRO专用数据的最小长度(nmin比特),以便进一步缩短要搜索的数据字段。

f)与d)或e)类似,但按照字节对准方式。

g)为了提高确定的可靠性,对另外的数据帧重复该搜索,例如紧随其后的数据帧、或其他数据帧。

有利地,在本发明中,不需要完整的mp3解码和部分或完整的mp3PRO解码来确定数据流是否为mp3PRO数据流。所需的处理容量最小。能够自动地并且按照更快的方式执行搜索和比特流类型的确定。

本发明可用于所有类似的数据结构中,包括视频数据结构,其中在固定数据帧中的未知位置处,可以传送附加数据,并且需要确定其存在。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号