首页> 中国专利> 用于产生高质量声音信号的自适应块长、自适应变换、及自适应窗变换代码、解码和编码/解码

用于产生高质量声音信号的自适应块长、自适应变换、及自适应窗变换代码、解码和编码/解码

摘要

一种音乐信号等声音信号的高质量低速率数字变换编码,通过对每一声音采样段自适应地选择一种最佳变换,窗函数及变换块长,实现变换代码中时间分辨力和频率分辨力之间的最佳权衡。它适用所有离散的正交变换。其正交性保证通过正/反变换精确地再现信号。自适应地选择正交变换的块长,而不丢失信息,即无量化误差。本发明的最佳实施例中,也将自适应技术与非正交变换一起使用,该自适应块长选择保持了变换特性;(1)在无系数量化误差的情况下完全消除了假频;(2)临界采样。选择变换相位项以消除时域假频。

著录项

  • 公开/公告号CN1055830A

    专利类型发明专利

  • 公开/公告日1991-10-30

    原文格式PDF

  • 申请/专利权人 多尔拜实验特许公司;

    申请/专利号CN91102167.1

  • 发明设计人 格兰特·阿兰·戴维森;

    申请日1991-04-06

  • 分类号G10L9/18;H03M7/02;

  • 代理机构中国国际贸易促进委员会专利代理部;

  • 代理人栾本生

  • 地址 美国加利福尼亚

  • 入库时间 2023-12-17 12:14:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-05-18

    专利权有效期届满 IPC(主分类):G10L19/02 授权公告日:20010307 期满终止日期:20110406 申请日:19910406

    专利权的终止

  • 2011-04-20

    专利实施许可合同备案的生效 IPC(主分类):G10L19/02 合同备案号:2011990000094 让与人:杜比实验室特许公司 受让人:联想(北京)有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 公开日:19911030 授权公告日:20010307 许可种类:普通许可 备案日期:20110223 申请日:19910406

    专利实施许可合同备案的生效、变更及注销

  • 2011-03-16

    专利实施许可合同备案的生效 IPC(主分类):G10L19/02 合同备案号:2011990000044 让与人:杜比实验室特许公司 受让人:浙江贝力生科技有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 公开日:19911030 授权公告日:20010307 许可种类:普通许可 备案日期:20110117 申请日:19910406

    专利实施许可合同备案的生效、变更及注销

  • 2011-02-09

    专利实施许可合同备案的生效 IPC(主分类):G10L19/02 合同备案号:2010990000986 让与人:杜比实验室特许公司 受让人:广州番禺巨大汽车音响设备有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 公开日:19911030 授权公告日:20010307 许可种类:普通许可 备案日期:20101216 申请日:19910406

    专利实施许可合同备案的生效、变更及注销

  • 2010-07-14

    专利实施许可合同备案的生效 IPC(主分类):G10L19/02 合同备案号:2010990000267 让与人:杜比实验室特许公司 受让人:天派电子(深圳)有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 公开日:19911030 授权公告日:20010307 许可种类:普通许可 备案日期:20100510 申请日:19910406

    专利实施许可合同备案的生效、变更及注销

  • 2010-05-26

    专利实施许可合同备案的生效 IPC(主分类):G10L19/02 合同备案号:2010990000163 让与人:杜比实验室特许公司 受让人:北京朝歌数码科技股份有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 申请公布日:19911030 授权公告日:20010307 许可种类:普通许可 备案日期:20100331 申请日:19910406

    专利实施许可合同备案的生效、变更及注销

  • 2010-03-31

    专利实施许可合同的备案 合同备案号:2009990001325 让与人:杜比实验室特许公司 受让人:四川长虹网络科技有限责任公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20001215 许可种类:普通许可 备案日期:20091216 合同履行期限:2009.10.13至2011.4.5合同变更 申请日:19910406

    专利实施许可合同的备案

  • 2006-11-29

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:061000030081 让与人:杜比实验室特许公司 受让人:佛山市三水好帮手电子科技有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20001215 备案日期:20060905 合同履行期限:2006年6月29日到2011年4月6日 申请日:19910406

    专利实施许可合同的备案

  • 2006-08-09

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:061000030039 让与人:杜比实验室特许公司 受让人:唯冠科技(深圳)有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20001215 许可种类:普通许可 备案日期:20060522 合同履行期限:2006年2月6日到2011年4月6日 申请日:19910406

    专利实施许可合同的备案

  • 2006-05-17

    专利实施许可合同的备案 IPC(主分类):IPC(主分类)G10L19/02 合同备案号:合同备案号061000030008 让与人:杜比实验室特许公司 受让人:佛山高飞电子有限公司 发明名称:发明名称用于产生高质量声音信号的解码器和编码器 授权公告日:20001215 许可种类:普通许可 备案日期:20060119 合同履行期限:合同履行期限2005年11月19日到2011年4月6日 申请日:19910406

    专利实施许可合同的备案

  • 2006-03-08

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:051000030114 让与人:杜比实验室特许公司 受让人:南靖万利达科技有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20001215 许可种类:普通许可 备案日期:20051230 合同履行期限:2005年6月7日到2011年4月6日 申请日:19910406

    专利实施许可合同的备案

  • 2005-10-26

    专利权人的姓名或者名称、地址的变更 变更前: 变更后: 申请日:19910406

    专利权人的姓名或者名称、地址的变更

  • 2005-04-13

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:041000030103 让与人:多尔拜实验室特许有限公司 受让人:汕头高新区爱多实业有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20010307 许可种类:普通许可 备案日期:20041110 合同履行期限:2003-12-10到专利权有效期 申请日:19910406

    专利实施许可合同的备案

  • 2004-05-26

    专利实施许可合同的备案 IPC(主分类):G10C19/02 合同备案号:041000030013 让与人:多尔拜实验室特许有限公司 受让人:圣马丁电子元件有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20010307 许可种类:普通许可 备案日期:20040324 合同履行期限:专利权有效期 申请日:19910406

    专利实施许可合同的备案

  • 2004-04-21

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:031000030246 让与人:多尔拜实验室特许有限公司 受让人:阿波罗电子集团有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20010307 许可种类:普通许可 备案日期:20031017 合同履行期限:专利权有效期 申请日:19910406

    专利实施许可合同的备案

  • 2002-12-18

    专利实施许可合同的备案 IPC(主分类):G10L19/02 合同备案号:200210120 让与人:杜比实验室认证公司 受让人:江苏新科电子集团有限公司 发明名称:用于产生高质量声音信号的解码器和编码器 授权公告日:20010307 许可种类:普通 备案日期:20020823 合同履行期限:2011年4月6日,9年,专利权期满止 申请日:19910406

    专利实施许可合同的备案

  • 2002-06-12

    其他有关事项

    其他有关事项

  • 2001-03-07

    授权

    授权

  • 1993-07-28

    实质审查请求的生效

    实质审查请求的生效

  • 1991-10-30

    公开

    公开

查看全部

说明书

一般地说,本发明是关于诸如音乐信号等声音信号的高质量、低比特速率(bit-rate)的数字变换编码。本发明通过对每个取样声音段自适应地选择最佳变换(transform)、窗函数及变换块长(block  length)来实现变换代码中时间分辨力(resolution)和频率分辨力之间的最佳权衡(trade  off)。

本发明适用于所有离散正交变换。变换的正交性保证了利用正/逆变换能够实现严格的信号重建(Signal  reconstruction)。因此,本发明允许对正交变换自适应地选择块长而不丢失信息,就是说,在没有量化误差(quantization  errors)的情况下,能够利用本发明的解码部分严格地恢复原始信号。

然而,在本发明的最佳实施例中却将自适应技术用于非正交变换。自适应块长选择技术保持了变换的下述特点:(1)在没有系数量化误差的情况下完全消除混淆(aliasing);(2)临界采样(Critical  Sampling)。选择了一个变换相位项(transform  phase  term)从而消除了时间域混淆(time  domain  aliasing)。

在信号处理领域的人们当中存在相当大的兴趣去发现用最少量信息来适当地表达给定信号的方法。通过减少所需信息,可以使信号在具有较低带宽的信道(Communication  Channels)上传送。 对于数字技术,最少信息需求与最少二进位需求是同义语。

有两个因素限制了位需求(bit  requirement)的降低。第一,带宽为W的信号可以由采样率不小于2·W的采样序列(Series  of  Samples)来精确表示。第二,采样信号可以是连续取值范围中的任何一个值,对它的量化会使信号的代表值中引入不精确量,这个不精确量与量化步长或分辨力成正比。这些不精确量叫作量化误差,它们与所能得到的代表信号采样量化值的二进制位数成反比。

如果将编码技术应用于满带宽,则全部量化误差(它们表现为噪声)将均匀地分扩散在这一带宽。可以应用于频谱中选定部分的技术能够限制量化噪声的频率扩散(spread)。两种这类技术是“子频段编码(Subband  Coding)”和“变换编码(transform  Coding)”。通过使用这些技术,能够在量化噪声特别有害的那些特定频段内,以较小步长量化那个频段,从而减小了量化误差。

子频段编码可以由多个数字带通滤波器来实现。变换编码可以由若干个模仿一组数字带通滤波器的由时间域到频率域的离散变换中的任何一种来实现。虽然离散变换与数字滤波器相比更易于实现,而且需要较少的计算能力和硬件,但它们缺少设计灵活性,因为由一个变换系数所代表的一个带通滤波器“频率仓”(frequency  bin)有一个均一的带宽。与此相反,一组带通滤波器能够设计成具有不同的子频带宽。然而,变换系数能够组合在一起来确定其带宽为单个变换系数带宽的倍数的“子频段”。这里用术语“子频段”来指整个信号频带中的各选定部分,而不论是由子频段编码或是由变换编码来实现的。由变换编码实现的子频段是由一组一个或多个相邻变换系数或者说频率仓来确定的。一个变换编码频率仓的带宽决定于编码的采样率和每个信号采样块中的采样数目(离散变换长度)。

子频段滤波器有两个特点,它们对于要达到高质量音乐信号编码的给定主观(Subjective)性能的数字处理系统所需要的位速率特别具有关键性。第一个特性是滤波器通带和阻带之间的区间(即过渡带)的宽度。第二个特性是阻带的衰减水平。这里所用的滤波器的“选择性”这一名词是指滤波器响应曲线在其过渡带的陡度(Steepness)(过渡带滚降(rolloff)陡度)以及在阻带的衰减水平(阻带的抑制深度)。

这两个滤波器特性对于编码的主观性能是极端重要的,这是因为人耳表现出来的频率分析性能犹如具有可变中心频率的高度非对称调谐(tuned)滤波器的频率分析性能。人耳调谐滤波器的频率分辨力在整个音频范围内随频率而变化。在频率500赫兹以下,人耳能分辨出频率靠近的几个信号,但是随着频率增大到可听(audibiloty)极限,信号频率相差增大才能分辨开。这种听觉滤波器的有效带宽称作临界带宽(Critical  band)。

临界带宽的一个重要性质是在临界带宽内音质掩蔽效应最强烈地表现出来-在临界带宽内的一个主信号能压低该临界带宽内任何位置的其他信号的可听能力。频率在临界带宽之外的信号不会这样强烈地被掩蔽。一个主信号不仅可以掩蔽与掩蔽信号同时发生的其他信号分量,而且可以掩蔽在掩蔽信号之前和之后发生的其他信号分量。在一个临界带宽内的前掩蔽效应和后掩蔽效应的持续时间决定于掩蔽信号的强度,但通常前掩蔽效应的持续时间比后掩蔽效应的持续时间短得多。对此,一般可参阅声音工程手册(Audio  Engineering  Handbook),K.B.Benson编,San  Francisco(旧金山):McGraw-Hill出版,1988,第1.40-1.42和4.8-4.10页。

音质掩蔽通过转换编码更容易实现,只要整个可听频谱范围内的子频段带宽大约是在频谱中同一部分的人耳临界频带的一半。这是因为人耳的临界频带具有可变的中心频率来适应声音刺激,而子频带和转换编码一般具有固定的子频带中心频率。为了最佳地利用音质掩蔽效应(PsyChoacoustic-masking  effects),由于一个主信号的存在而造成的失真信号(distortion  artifact)都应该限制在含有该主信号的子频段内。如果子频段的带宽为临界频带的一半左右或者小于一半,而且滤波器的选择性足够高,那么即使信号频率靠近子频段通带带宽的边缘,也有可能对不希望要的失真信号进行有效的掩蔽。如果子频段带宽大于一个临界频段的一半,则有可能由于主信号使人耳的临界频带偏离编码子频带,从而使一些处在人耳临界带宽之外的不希望的失真信号不能被掩蔽。这一效应在人耳临界频带较窄的低频段是最有害的。

变换编码的性能和比特速率要求还依赖于其他因素,包括信号采样块长、变换编码误差、以及消除假频(aliasing  cancellation)。

块长(block  length)

信号取样块长影响变换编码的时间分辨力和频率分辨力。对于较长的块长,时间分辨力一般较差,因为量化误差会使变换编码/解码系统“模糊”(Smear)了在整个信号采样块长度上的一个采样信号的各频率分量。在由逆变换恢复的信号中的时间畸变对于持续时间短的事件(event)或瞬时信号是最容易听得出来的。瞬变信号的时间畸变将表现为瞬变前和瞬变后的振鸣(ringing)。

对于较短的块长其频率分辨力较差,因为此时离散变换频率仓(bin)较宽而滤波器选择性较低(降低了过渡带滚降率并减低了阻带抑制水平)。这种滤波器性能的降低会造成在邻近的频率仓内出现不希望的变换系数来响应所需信号。这些不需要的分量是所谓“边瓣泄漏(Sidelobe  Leakage)”效应的结果。

这样,短块长可以造成标称(nominal)滤波器带宽在较低频段或全部频段上超过人耳临界带宽。即使标称子频段带宽比人耳临界带宽要窄,其滤波器性能的降低却表现为一个宽过渡带和/或差的阻带抑制水平,可以在人耳临界带宽之外造成显著的信号分量。另一方面,长块长可能造成差的时间分辨力,使变换编码造成出现在人耳时间音质掩蔽间隔之外的信号畸变分量。

变换代码误差

离散变换不能产生绝对精确的一组频率系数,因为这些离散变换只作用于有限长的一段信号。严格地讲,离散变换产生的是时间域信号的时间-频率表示,並不是它的真正的频率域表示,后者需要无限变换长度。然而,这里为便于讨论,将把离散变换的输出称作频率域表示。从效果上看,离散变换假定采样信号只含有其周期为有限采样段长度的约数(Submultiple)的那些频率分量。这等效于假定有限长信号是周期性的。当然,这一假定通常并不成立。假定的周期性造成有限时间段边缘的不连续性,它使变换产生虚假的高频分量。

减小这种效应的一种技术是在变换之前通过对信号采样加权使其时间段边缘附近的采样为零或接近于零,借以减小其边缘不连续性。在时间段中央的采样一般为不变化地通过,即加权因子为1。这一加权函数称作“分析窗”。窗的形状直接影响滤波器的选择性,降低过渡带滚降率和阻带抑制水平。某些窗的形状所引起的这种滤波器性能降低要大大小于其他窗形状。

这里使用的术语“分析窗”只是指实行正变换之前使用的窗函数。如下面将要讨论的,在本发明中使用的分析窗可以由合成窗设计考虑(Synthesis  window  design  considerations)来约束。所以,作为本领域技术中一般使用的术语“分析窗”的设计和性能特性可能与本发明中应用的这种分析窗不同。

分析窗是一个时间域函数。如果不提供窗效应的补偿,则恢复的或“合成的(Synthesized)”信号将会依其分析窗的形状而产生相应的畸变。称作“重迭加(Overlap-add)”的一种补偿方法是本领域所熟知的。这种方法要求编码器去变换输入信号采样的重迭块。通过小心地设计分析窗,使两个相邻窗在其重迭部分相加为单位1,于是窗效应被完全补偿。

当采用某些类型的变换,例如离散付立叶变换(DFT)时,这项补偿技术增加了表示该信号所需二进位的数目,因为在重迭时间段的信号部分必须变换和传送两次,即在两个重迭信号采样块各有一次。这种变换不是临界采样的。术语“临界采样的(Critically  Sampled)”是指该变换在其时间区间上给出的频率系数数目与它接收的输入信号采样数目相同。因此,对于非临界采样变换,希望所设计的窗的重迭区间尽可能小。

某些变换(包括本发明最佳实施例中使用的那一种)要求逆变换的合成输出加窗。合成窗(Synthesis  window)用于对每个合成信号块整形。所以,合成信号将是受过分析窗和合成窗调制过的。这种两步调制在数学上类似于用这样一个窗来调制原始信号一次,该窗的形状等于分析窗和合成窗的采样点逐点乘积。所以,为了用重迭相加来补偿窗畸变,两个窗的设计必须使得两个窗的乘积在重迭相加区间之和为单位1。

尽管没有唯一的标准可用来评价一个窗的好坏,但是,如果与这个窗合用的滤波器的选择性被认为是“好”的,通常就认为这个窗是“好”的,所以,一对设计得好的分析/合成窗能减少边瓣泄漏。

减少边瓣泄漏是重要的,因为泄漏会使变换造成的频谱系数错误地表示成滤波器通带外的信号分量频率。这种错误表示(misrepresentation)是一种畸变,称作“混淆(aliasing)。”

消除假频

奈奎斯特(Nyquist)定理指出,当采样点之间的间隔不大于信号最高频分量的周期的一半时,该信号能由离散采样精确地恢复。当采样率低于这个奈奎斯特采样率时,较高频分量被错误地表示成较低频分量。这种较低频分量是真正分量的“假频(alias)”分量。

子频段滤波器和有限长数值变换都不是完美的带通滤波器。通带和阻带之间的过渡不是无限陡的,而且在阻带中信号的衰减不是无限大。结果,即使将一个带通滤波后的信号按照由通带截止频率给出的奈奎斯特采样率来采样,那么能够通过该滤波器的超过滤波器标称频率的信号(当然被衰减了)将不能被可靠地表示出来。

有可能设计出分析滤波器和合成滤波器从而使假频畸变被逆变换自动消掉。二次镜象滤波器在时间域具有这种特性。某些变换编码技术,包括本发明的最佳实施例中使用的那种,也能消掉假频畸变。

随着采样块长变短,压低变换编码中假频畸变的可听后果(audible  Consequences)就变得更加困难。如前面解释过的,较短的采样块会降低滤波器性能:通带宽度增大,通带到阻带的过渡陡度降低,以及阻带抑制能力减弱。结果,假定信号以滤波器标称截止频率作为奈奎斯特采样率进行采样,那么在截止频率以上的频率分量以较小衰减通过滤波器从而使假频混淆变得更加显著。

即使在原理上正变换和逆变换可以消除假频畸变,但量化误差将使逆变换不能完全消除假频畸变。残余假频畸变将是可听见的,除非这种畸变在音质上(Psychoacoustically)被掩蔽掉。然而,以短采样块来变换时,一些变换频率仓(bin)的通带可能大于听觉临界频带,特别是在低频段,其人耳临界频带有最大的分辨力。结果,假频畸变可能未被掩蔽。减小这种畸变的一种途径是在有问题的子频段中增大量化精度,但这会增加所需的比特速率。

本发明的一个目的是采用一种编码/解码技术和方法对宽带声音信息(特别是音乐)进行数字处理,它能以96千位/秒(kbs)的低编码速率提供出高主观质量的声音。

本发明的目的之二是所提供的这种编码/解码技术和方法适于宽频带声音信号的高质量传送、存贮和再生,这里的再生质量适合于例如广播声音链路。

本发明的目的之三是使再生质量的主观感觉如同从密纹唱片得到的一样好。

本发明的目的之四是所提供的这种编码/解码装置和方法所采用的数字处理系统只需要小量空间来存贮编码信号。

本发明的目的之五是提供来选择最佳变换块长度。

本发明的目的之六是用于对每个采样声音信号段根据信号的特性(例如是否是瞬变信号)从一组窗函数中选择出最佳的分析窗函数。

本发明的目的之七是用于对每个采样声音信号段根据其信号特性(例如是否是瞬变信号)来从一组离散变换函数中选出最佳离散变换。

本发明的目的之八是对于用低比特速率离散变换来处理宽频带声音信号特别是音乐信号时产生的畸变提供时间上的音质掩蔽。

关于本发明的上述目的及其他目的的进一步细节将在本发明的文件中给出,特别是在下文中的“本发明详细描述”一节中给出。

根据本发明的原理,一个编码器提供宽带声音信息的数字编码功能。宽带声音信号被采样、量化和以N个采样点为一组组成时间域信号采样块。一个信号分析器(analyzer)对当前信号采样块进行数值分析以确定适当的变换类型、块长和窗类型,以使编码保真度(fidelity)最佳。在一个具体实施例中,有一个瞬变信号检测器来确定在当前信号采样块中是否存在任何瞬变信号需要更短的块长度以避免可听见的瞬时畸变。具有这类瞬变信号的采样块被再分割成最佳长度采样子块,以保持足够的变换频率选择性,并保证在音质上掩蔽掉由瞬变信号引起的编码畸变。每个采样块,不论是正常长度的还是减小了长度的,都被一个根据瞬变信号检测器输出而选定的分析窗函数来调制。然后,根据瞬变信号检测器输出所选定的离散正变换,响应经分析窗加权的时间域采样块,产生出频率域频谱分量。确定编码器所用信号采样块长度、分析窗函数和正变换类型所需的信息作为编码变换系数的伴随信息被传送给解码器。

也是根据本发明的原理,一个解码器提供了由本发明的编码器编码的数字编码宽带声音信号的高质量再生信号。将确定所选信号采样块长度、分析窗函数和正变换类型的伴随信息从编码信号中提取出来。将这一信息用于建立逆变换长度,并报告合成窗函数和离散逆变换类型的选择。通过一个具有与产生频率域频谱分量的编码器中的特性相反特性的离散变换,响应其频率域频谱分量而产生时间域信号采样块。在使用离散变换的本发明实施例中需要各采样块由合成窗调制。如果使用的话,该解码器合成窗和编码器分析窗的形状应使两个相邻重迭采样块的组合窗函数之和为单位1。将相邻采样块重迭相加以消除窗调制的加权效应和恢复时间域信号的数字再生信号,然后再把它转换成高质量模拟输出。

再根据本发明的技术,一个编码/解码系统提供了宽频带声音信息的数字编码和高质量再生。在该系统的编码器部分,宽带声音信号被采样、量化和按N个采样点长度将信号分组构成时间域信号采样块。一个信号分析器对当前信号采样块进行数值分析以确定适当的变换类型、块长和窗类型,以使编码保真度最佳。在一个具体实施例中,有一个瞬变信号检测器来确定在当前信号采样块中是否存在任何瞬变信号需要更短的块长度以避免可听见的瞬时畸变。将具有这类瞬变信号的采样块再分割成最佳长度采样子块,以保持足够的变换频率选择性,并保证从音质上掩蔽掉由瞬变信号引起的编码畸变。每个采样块,不论是正常长度还是减小了长度的,都被一个根据瞬变信号检测器输出而选定的分析窗函数来调制。然后,根据瞬变信号检测器输出而选定的离散正变换,响应经分析窗加权的时间域采样块,从而产生出频率域频谱分量。将确定编码器所用信号采样块长度、分析窗函数和正变换类型所需的信息作为编码变换系数的伴随信息传送给解码器。系统的解码器部分经过存贮装置或传输路径接收编码器的数字输出。解码器部分从编码信号中提取确定所选定的信号采样块长度、分析窗函数及正变换类型的伴随信息。将这一信息用于建立逆变换长度,并报告合成窗函数和离散逆变换类型的选择。通过一个与产生频率域频谱分量的编码器中的特性相反的离散变换,响应其频率域频谱分量,产生时间域信号采样块。在使用离散变换的本发明实施例中需要各采样块由合成窗调制。如果使用的话,该解码器合成窗和编码器分析窗的形状应使两个相邻重迭采样块的组合窗函数之和为单位1。将相邻采样块被重迭相加以消除窗调制的加权效应和恢复时间域信号的数字再生信号,然后再把它转换成高质量模拟输出。

根据本发明的技术,在一个具体实施例中有一个瞬变信号检测器,当需要以较短的信号长度来保证在音质上掩蔽由大瞬变信号造成的畸变信号时,该检测器便相应地选择比本发明通常使用的最大块长要短的信号采样块长度。让数字化信号采样通过一个高通滤波器并被分成子块。将每个子块中的峰值幅度与前一个子块中的峰值幅度相比较。如果相邻峰值振幅的变化没有超过预先给定的阈值,则编码器使用最大信号采样块长度。如果相邻子块的振幅变化超过了预定的阈值,则选择较短的块长度。

对于每个信号采样块,选定一个分析窗函数,它适合于信号采样块的信号成分和由瞬变信号检测器选定的块长度。如前面讨论过的,这个分析窗函数用于调制信号采样块内的采样,以改善离散变换的总体性能。在本发明的编码器的一个实施例中,分析窗是由同一类型而不同长度的多个窗函数中选出的。

在本发明中可以采用其形状随着块长度或瞬时特性的函数而改变的窗函数,而不偏离本发明的范围和目的。例如,本发明的一个实施例可以选择这样一个窗,它对于含有瞬变信号的信号采样块提供较高的阻带抑制能力,其代价是过通带滚降较浅(Shallower)。然而,窗函数的选择不能违反约束条件,例如重迭相加特性的约束。

在本发明的编码器的一个实施例中,离散正变换响应经分析窗加权的时间域采样块产生频率域频谱分量。离散变换的长度置成等于由瞬变信号检测器选定的信号采样块长度。

任何正交的时域到频域变换都能使用。但本发明的一个最佳实施例使用了一个非正交离散变换,它等效于一个修正的离散余弦变换(DCT)和一个修正的离散正弦变换(DST)的交替使用。在另一个实施例中,由单一的修正的离散余弦变换(DCT)来实现其非正交离散变换。

精通本领域技术的人应该理解,可以根据选定的块长或瞬变信号特性选定相应的不同正交离散变换。可以从多个离散变换中适当地选择一个离散正交变换,而不偏离本发明的范围或精神。

例如,本发明的一个实施例能够正常使用一个通常的DCT(离散余弦变换)并选择一个通常的DST(离散正弦变换)用于宽有瞬时脉冲的信号采样块。在当今技术中已知,低频分量的编码精度对于大多数音乐信号实现给定的主观质量而言是很足够的。通常的DCT对低频信号具有优越的编码性能。另一方面,较高频率分量的编码精度对于瞬变信号实现给定的主观质量水平是很重要的。通常的DST对于较高频率信号具有优越的编码性能。所以,本发明的一个实施例中可以适应地选择最适于每个信号段编码的变换。

在编码器和解码器的一个最佳实施例中,所用采样率为44.1千赫兹。尽管该采样率不是临界采样率,44.1千赫兹是一个适当的采样率,而且它是方便的,因为它也是密纹唱片采用的采样率。另一个实施例采用48千赫兹采样率。在采用44.1千赫兹采样率的最佳实施例中,标称频率响应延伸到15千赫兹,时间域采样块的最大长度为1024个采样点。可以适当地选择较短的长度:512、256、或128个采样点。在本发明的一个最佳实施例中,在适于专业广播使用的主观质量水平上的音乐编码可以用低达96Kbs(包括错误校正代码等附加信息)的几种位速率来实现。也可以使用产生不同水平信号质量的其他速率而不偏离本发明的基本精神。

在下面的“本发明详细描述”一节将结合附图更详细地说明本发明的各个特点及其最佳实施例。

图1a和1b是说明本发明基本功能结构的功能块图。

图2a到图2e中的方块图给出本发明一个实施例的硬件构成。

图3a和3b中的方块图更详细地给出本发明的一个双通道实施例中处理机的串行通信接口。

图4a到图4e为假设的图形表示,用以说明一个时间域信号分组成一系列重迭的、加窗的时间域信号采样块。

图5a到5d为假设的图形表示,用以说明由E-TDAC变换产生的时间域假频畸变。

图6a到图6g为假设的图形表示,用以说明借助E-TDAC变换信号合成过程中的重迭相加来抵消时间域假频信号。

图7q是假设的图形表示,用以说明由一对信号采样块构成单道系统中的框架。

图7b是假设的图形表示,用以说明由一对信号采样块构成双通道系统中的框架。

图8a是带有一个瞬时脉冲的模拟音乐信号段的图形表示。

图8b是合成音乐信号段的图形表示,它是用一个固定的信号采样块长512采样点,通过编码/解码系统从一个信号采样块恢复而来的。

图8c是合成音乐信号段的图形表示,它是由本发明的一个实施例采用固定帧排列(Eixed-Frame  Alignment)技术以最大信号采样块长512采样点恢复得来的。

图9的示意图表示一个递归滤波器,它实现了本发明编码器部分的瞬时信号检测器中所使用的高通滤波器。

图10是一个假设的图形表示,说明瞬变信号检测器如何将一个信号采样块的一半分成一组更短长度的子块。

图11是一个假设的图形表示,说明瞬变信号检测器如何在一个层次结构(hierarchical)子帧内识别每一个子块中的举振辐值。

图12是一个二进制树的假设的图形表示,说明由瞬变信号检测器的比较器部分构成的节点。

图13是一个流程图,给出本发明一个实施例中使用的瞬变信号检测器的比较器部分的逻辑。

图14是一个假设的图形表示,说明由瞬变信号检测器的比较器部分对二进制树的修正过程。

图15是一个假设的图形表示,说明由瞬变信号检测器根据所示二进制树选定的子块长度。

图16是一个音乐波形的图形表示,它是按本发明的瞬变信号检测器部分所选定的子块长度区间迭加而成的。

图17是时间域信号采样块的假设图形表示。

图18是时间域信号采样块的又一个假设图形表示,说明当假定块内信号为周期性时由离散变换引起的在采样块边缘的不连续性。

图19a是一张功能块图,给出函数X(t)被函数W(t)调制,结果生成函数Y(t)。

图19b到19d是说明时间域信号采样块被一个分析窗调制情况的进一步假设图形表示。

图20是适用于本发明的一个最佳实施例的一族分析一合成窗的图形表示。

图21a至21c是一系列信号采样块的假设图形表示,用以说明固定帧排列(Fixed-Framc  Alignment)技术。

图22a用图形表示出使用完全对称的只作分析的窗的一组滤波器的过渡带滚降和阻带抑制,并与只用这种窗的前半部的一组滤波器的过渡带滚降和阻带抑制相比较。

图22b用图形表示出使用完全对称的只作分析的窗的一组滤波器的过渡带滚降和阻带抑制与使用非对称的只作分析的窗的一组滤波器的过渡带滚降和阻带抑制的比较。

图23a是一个假设图形表示,说明由E-TDAC变换采用通常的相应项造成的时间域假频分量信号的时间逆转(reversal)区间。

图23b是一个假设图形表示,说明由E-TDAC变换采用固定框架排列技术所要求的相位项造成的时间域假频分量信号的时间逆转区间。

图23c是一个假设图形表示,说明采用为消除一个信号采样子块中的时间域假频信号所需要的相位项时,由E-TDAC造成的时间域假频分量信号的时间逆转区间。

图24是一种桥变换(bridge  transform)的假设图形表示,说明时间域假频分量信号的时间逆转区间。

图25是一系列信号采样块的假设图形表示,说明扩展的固定帧排列技术。

图26a至26f是流程图,说明本发明的扩展固定帧排列技术实施例所需要的帧控制逻辑。

图27是一系列可变长度信号采样块的假设图形表示,用以说明动态帧排列(Dynamic-Framc  Alignmcnt)技术。

图28的假设图形表示显示出相邻加窗块的重迭-相加性质。

图29a至29e为假设图形表示,说明一个时间域信号被分成一系列重迭的和加权的时间域信号采样块,特别是为O-TDAC变换使用。

图30a至30d中的假设图形表示说明由O-TDAC变换造成的时间域假频畸变。

图31a至31g中的假设图形表示说明在O-TDAC变换的信号合成过程中通过重迭-相加得到的时间域假频信号抵消。

图32的假设图形表示说明为消除时间域假频信号由固定帧排列所要求的O-TDAC变换相位项。

图33a和33b是E-TDAC和O-TDAC变换的变换系数带宽的假设图形表示。

表Ⅰ给出用于瞬变信号检测器第一部分的αKHj高通滤波器的系数。

表Ⅱ给出用于瞬变信号检测器第一部分的4KHz高通滤波器的系数。

表Ⅲ给出瞬变信号检测器第4部分中的增高/衰减(attack/decay)阈值,用于确定构成瞬时信号状态所需的信号振幅变化量。

Ⅰ.本发明的硬件实现

图1a和1b给出本发明的基本功能结构。图1a中所示本发明的编码器部分包括时间域信号输入102、低通滤波器104、信号采样器和量化器106、信号采样缓存108、瞬变信号检测器110(它选择信号采样块长度)、分析窗调制器112(它用分析窗函数调制数字化时间域信号块)、数字滤波器组116(它把采样和量化的信号变换成频率系数)、帧(frame)控制器114(它根据选定的信号采样块长度来控制分析窗调制器和滤波器组)、量化器118(它根据所要求的主观信号质量和音质效应来对变换系数编码)、以及格式器(formatter)120(它把编码的频率系数和选定的信号采样块长度组合成二进制位流,供传输或存贮之用)。图1a中显示出一个传输路径122,然而应该理解,其编码信号可以被存贮起来供其后使用。

图1b所示本发明的解码器部分包括:编码二进位流信号输入132、格式解析器(deformatter)134(它从组合二进位流中提取每个编码频率系数和选定的信号采样块长度)、线性化器(Lineariger)136(它把每个编码系数转换成线性取值的变换系数)、帧控制器140(它根据所提取的信号采样块长度来控制反滤波器组和合成窗调制器)、逆字滤波器组138(它将变换系数变换成时间域信号块)、合成窗调制器142(它用选定的合成窗函数来调制每个合成的时间域信号块)、信号块重迭相加器144(它恢复时间域信号的数字表示)、模拟信号发生器146、低通滤波器148、以及模拟信号输出150。

A.处理硬件

图2a-2c和图3a-3b绘出本发明的基本硬件结构。经验研究表明:常规的整数变换计算必须以至少20个有效二进位的精度来完成才能达到所宣称的性能指标。

本发明的一个单通道方案(采用44.1KHz采样率或48KHq采样率)的最佳实施例的实际实施中利用了一个16位模-数转换器(ADC),其周期时间不超过20微秒,用于量化输入的时间域信号。每个16位数字化采样用于构成24位字的16个高有效位,该24位字将用于其后的计算。以20.5MHz无等待形态运行的Motorola  DSP56001  24位数字信号处理器(DSP)用于完成所需要的计算和控制编码与解码处理过程。静态随机存取存贮器(RAM)为DSP提供程序和数据存贮器。周期时间不大于20微秒的16位数-模特换器(DAC)用于从解码的数字信号产生模拟信号。

图2a所示编码器硬件结构由下列部件构成:模拟信号输入200、低通滤波器(LPF)200A、ADC201、DSP202、静态RAM203、可抹挣可编程只读存贮器(EPROM) 204、及编码串行信号输出206。LPF200A保证输入信号为有限带宽。ADC201将输入信号数字化(采样和量化),变成串行16位字流。DSP202按收并暂存数字化采样串行流、检测是否存在任何瞬变信号、选择信号采样块长度、将采样分组构成采样块、用分析窗函数调制采样块、完成将采样块变换到频率域所需的计算、对变换系数编码、将代码字和信号采样块长度格式组合到数据流中,并通过串行数据通道206将编码信号传送出去。DSP的程序和数据工作区存贮于3个24KB(千字节)静态RAM组203中,它们组织成了3组,各含有8,192个24位字。DSP要求快速访问时间的程序存贮器,这可以在RAM中实现,比在可编程ROM中实现要更廉价。因此,EPROM204以压缩格式存贮程序和静态数据,当编码器第一次加电时DSP将压缩格式的数据分解成可使用形式送入RAM203。

图2b和2c给出了2个DSP接口的更详细结构。图2b给出DSP202、ADC201及串行数据通道206的数据通信接口。时间发生器202A为编码器产生接收计时、字同步、和传送计时信号。线SCO计时控制数字化输入信号采样的串行二进位流从ADC201经母线SDR进入DSP202。线SCI向ADC和DSP提供字同步信号,用于标志每个16位字的起始。线SCK计时控制编码信号串行位流沿着线STD从DSP进入串行数据通道206。

图2c给出存贮器选址接口。Motorola  Dsp56001的存贮器被分成四段:程序ROM、程序RAM、X数据、及Y数据。当线PS为低时只有程序RAM203或EPROM204被选通,但它们被映射(mapped)到各自的地址空间。转换器205C允许DSP202根据地址线A15的状态来选择RAM或EPROM。当DSP置A15为高时,转换器205C置RAM203和EPROM204的片选通(Chip-Select)(CS)线为低。当DSP202置A15为低时,转换器205C置RAM203和EPROM204的CS线为高。当线CS为高而线PS为低时,选通程序RAM203。

当DSP使线DS为低和线XY为高时,选通RAM203的X数据库。当DSP使线Xy为低和线CS为高时,RAM203的y数据库被选通。

图2d给出解码器硬件结构,它包括:编码的串行信号输入路经207、DSP208、静态RAM209、EPROM210、DAC212、LPF213A、以及模拟信号输出213。DSP208接受和暂存编码信号、将信号格式解析成编码变换系数和信号采样块长、完成将系数变换到时间域所需的计算、将系数分组构成时间域块、用合成窗函数调制这些块(如果在编码器/解码器中使用的离散变换不需要使用合成窗,则不需进行合成窗调制)、将这些块重迭相加构成数字采样的时间域序列、以及将串行位流形式的数字采样传送给DAC212。DSP的程序和数据工作区存贮于3个24个KB静态RAM209组中,它们被组织成3组,各有8,192个24位字。EPROM210以压缩格式存贮程序和静态数据中,当解码器第一次加电时DSP将这些压缩格式数据分解成可用形式送入RAM209。DAC212产生一个模拟信号,对应于来自DSP的串行数据流。LPF213A保证信号输出213不含有由于编码/解码过程造成的任何虚假的高频分量。

图2e给出DSP208、串行信号输入通道207及DAC212之间的串行通信接口。时间信号发出器208A使用锁相环电路从编码串行位输入信号中提取出定时基准信号,为解码器产生接收定时信号、字同步、及传送定时信号。线SCO定时控制串行位信号沿线SRD进入CSP208。线SCK计算控制编码数字信号采样的串行位流沿线STD从DSP208进入DAC212。线SC2向DAC和DSP提供字同步信号,它标志每个16位字的起始。DSP208和内存贮器地址总线之间的接口的实现方式与前文中对编码器的同类接口的实现方式相同。参见图2C。

基本硬件结构可以被修正。例如,一个以27MHz无等待状态运行的,Motorola  DSP56001如果采用简单量化技术,便能够实现双通道编码器或解码器。

编码器的双通道实施例需要有LPF200A和和200B、ADC201A和201B,按图3a所示方式联接。在DSP和ADC部件之间是接口的运行方式与上文描述的单通道编码器的接口运行方式类似。定时信号发生器202A以字同步信号速率一串的速率向DSP的线SC2提供一个附加信号,用以控制多路转换器202B和向DSP指出两个ADC中当前是哪一个在发送数字化数据。

一个解码器的双通道实施例需要DAC212A和212B、LPF213A和213B,按图3b所示方式联接。DSP和DAC部件之间的接口运行方式与上文描述的单通道解码器接口的运行方式类似。定时信号发生器208A以字同步信号速率的一串的速率向DSP的线SC1提供一个附加信号,用于控制信号分离器(dcmultiplexer)208B并向DSP指出两个DAC中哪一个当前正在接收数字数据。

再有,可以使用专门化的硬件来实现某些功能,例如窗调制或快速向立叶变换(FFT)。整个编码器/解码器可以在一个专门设计的集成电路中实现。对于精通本门技术的人而言,显然有许多其他可能的实现方法。

B.输入信号采样和缓存

在本发明的一个最佳实施例中,图1a所示的信号采样器和量化器106是一个模-数转换器,它把输入信号量化成16位,然后在右边补上8个零,构成一个24位二进制整数形式。所有其后的变换计算都是以24位二进制整数的算术运算来实现的。模拟输入信号被图1a中框104所示低通滤波器(LPF)限制其宽带最高为15KHz(对于20KHz带宽的编码器,带宽限制在20KHz)。

具有至少是密纹唱片(CD)质量的音乐信号,除了具有其他特性外,其带宽超过15KHz。根据奈奎斯特定理,已知15KHz带宽的信号采样率必须不低于30KHz。对本发明的一个实施例选用了44。1KHz的采样率,因为这是在CD的应用中使用的速率,而且这一选择简化了在这类应用中使用本发明所必须的装置,(这一采样率也支持本发明的另一种20KHz带宽的实施例)。

也可以利用其他采样率,例如48KHz是通常许多专业性声音系统应用中使用的速率。如果选用另一个采样率,那么相邻变换系数之间的频率间隔将要改变,代表希望的信号带宽所需要的系数个数也将改变。对于精通本门技术的人而言,采样率变化对实现本发明所造成的全部影响是显而易见的。

Ⅱ.本发明的最佳实施

A.分析滤波器族(bank)-正变换

实现本发明的细节受所选择的离散变换的影响,该离散变换用于实现图1a中框116所代表的数字滤波器族的功能。几种变换技术中的任何一个都可以用来实现这滤波器族。在本发明的一个最佳实施例中使用的变换技术首先见Princen和Bradley的“基于在时域抵消假频信号的分析/合成滤波器族设计”IEEE  Trans.on  Acoust.,Speech,Signal  Proc(声学、话言、信号处理),Vol(卷)ASSP-34,1986,1153-1161页。这一技术是一个偶迭加临界采样单边分析合成系统(evenly-stacked  cnticallq  sampled  single-sideband  analqsis-synthesis  system)的时间域等效技术。在此地将这一变换称作“偶迭加时间域抵消假频”(Evenlq-Stacked  Time-Domain  Aliasing  Cancellation)(E-TDAC)技术。TDAC变换的另一种形式可以用于本发明的另一实施例。该技术在Princen、Johnson和Bradleq的下列文中描述过:“基于时间域消除假频信号的子频带/变换编码用滤波器族的设计”,ICASSP1987  Conf.Proc.,1987年5月,2161-64页这另一种变换是“迭加临界采样单边带分析合成系统”的时间域等效技术。在此地将这一变换称作“迭加时间域抵消假频”技术(O-TDAC)。

在下面充分描述了E-TDAC实施例之后,将讨论使用O-TDAC变换和用快速付立叶变换(FFT)来实现离散付立叶变换(DFT)的本发明实施例。

E-TDAC使用的变换函数等效于交替使用修正的离散余弦变换(DCT)和修正的离散正弦变换(DST)。方程1所示DCT和方程2所示DST是:

当O≤K<N(1)

当O≤K<N(2)

这里K=频率系数序号,

n=输入信号采样序号,

N=信号采样块长度,

m=E-TDAC的相位项,

X(n)=输入信号X(t)在采样点n的量化值,

C(k)=DCT第K个系数,

S(k)=DST第K个系数。

E-TDAC变换对于每个信号采样块交替产生两组频谱系数或变换块之一。这些变换块的形式是

当O≤K< (N)/2 (3)

当K= (N)/2

当O<K≤ (N)/2 (4)

当K=0

这里i=信号采样块序号,

C(K)=DCT系数(见方程1),

S(K)=DST系数(见方程2)。

Princen指出,利用适当的相位分量m(见方程6)和精心设计的一对分析合成窗,E-TDAC技术能从固定长余弦和正弦变换块的交替序列中精确地恢复输入信号。这一序列的形式是

{C(k)}0,{C(k)}1,{C(k)}2,{S(k)}3,……(5)

这里每个变换块代表一个时间域信号采样块。这一处理过程见图4a-4e、5a-5d及6a-6g。

参考图4a,可以看到量化输入信号X(t)被分组构成块。一组块经过窗函数Wc(示于图4b)调制,产生信号Xc(t)(示于图4d)。信号Xc(t)输入到DCT。另一组采样输入信号X(t)的块以二分之一块长与第一组重迭,被窗函数Ws(示于图4c)加窗(这个窗函数与Wc完全相同,但在时间上移动了二分之一块长),产生出信号Xs(t)(图4e所示),然后被送到DST。

如果只是交替使用DCT和DST变换块,会使变换块的被去挣的那一半中所包含的信息丢失。这一损失产生了时间域假频分量,但这一畸变可以通过在方程1和2中选择适当的相位项m、应用正变换去重迭时间域信号块以及通过重迭和相加由逆变换恢复的相相邻的时间域信号采样块的办法来消除。

方程1和2中的相位项m控制时间域假频畸变的相移。图5a-5b和6a-6g以图说明了这一畸变。从逆DCT恢复的信号Yc(t)示于图5a。图5b说明了被恢复的信号由两个分量组成:加窗的原始信号(实线)及时间域假频畸变(虚线)。图5c和5d给出由逆DST恢复的信号Ys(t)的类似信息。为了消除这一假频畸变並精确地恢复原始时间域信号,E-TOAC要求其假频信号如下所述:对于DCT,时间域假频分量的构成是:采样信号的前一半在时间上以采样块四分之一点为参考点逆转,采样信号的后一半在时间上以采样块四分之三点为参考点逆转。对于DST,假频分量与DCT的相似,只是其振恢的符号相反。见图5b和5d。为消除假频信号所需相位项是

这里N=信号采样块长度。

E-TDAC也要求将一对精心设计的分析-合成窗应用于重迭的信号采样块。信号采样块必须有100%重迭,即给定块的50%被前一块重迭,而同一块的另50%被它的后续块重迭。图6a-6g说明了信号采样块的重迭和造成的假频畸变的抵消。图6a和6d所示信号Yc(t)和Ys(t)是从逆DCT和DST恢复而来的,它们分别被窗函数Wc(t)和Ws(t)调制(如图6b和6e所示),产生出示于图6c和图6f的信号Yc(t)和Ys(t)。当这些加窗信号的重迭块相加时,假频分量被抵消,所产生的信号Y(t)(示于图6g)是原始输入信号X(t)的精确重建信号。

下面更详细地讨论窗设计和合成过程中使用的重迭-相加。在这一点上注意到下述情况就是够了:略挣变换块的二分之一使所需位速率减半,但100%窗重迭(这是在信号合成过程中E-TOAC所要求的)使所需位速率加倍。结果,E-TDAC是临界采样的,并对所需位速率是有中性影响。

E-TDAC所用的计算算法是快速付立叶变换(FFT)。参见Cooleq和Tukeq的“复付立叶级数的机器计算算法”,Math.Comput.卷19,1965,297-301页。单次FFT能用来同时完成两个等长度信号采样块的修正DCT和修正DST,其作法是规定每一块分别为一个单一复变换的实分量和虚分量。这一技术利用了这一事实:FFT是一个复变换,而两个输入信号采样块只含有实数值采样。通过将这些变换因式分解成一个FFT和一个复常数阵到(arraq)的汞积,DCT系数从FFT中产生,作为一组实部值,而DST系数由一组虚部值表示。所以,一个信号采样块的DCT能与另一个长度信号采样块的DST同时计算,只需一个FFT后接受数阵列相汞的相加。

使用一个FFT同时计算两个变换的基本技术是在本门技术中众所周知的,并由Brigham在下列书中描述:速快付立叶变换,Englewood  Cliffs,NJ:Prentice-Hall,Inc.,1974。关于同时计算E-TDAC变换所需的修正的DCT和修正的DST的附加信息可在Lookabaugh的博士论文中找到:“话言的可变速率和自适应频率域失量化”Stanford,CA:Stanford  Universitq,PhD  Thesis,1988年6月。

在本发明的单通道方案的一个实施例中,两个相邻的重迭的最大长度信号采样块被存放在缓存区并一同传送到一对DCT/DST块中。如图7a所示,这个块对构成了一帧(frarne)。然后将这一帧中的两块量化和格式化供传输或存贮。

在双通道系统中,通过处理来自两个通道中每一个的最大长度信号采样块,可以实现同时计算两个块的变换:从一个通道产生一个CCT块,从第二个通道产生一个DST块。这对块构成一帧。见图7b。对于给定通道的编码块在DCT和DST之间交替变换(见表正式5),并且其类型总是与另一通道块的相反。在一帧中的两块被一起变换和格式化。

然而,对于本发明的一个最佳实施例,正变换的同时处理更复杂,因为本发明可以自适应地选择信号采样块长度。如下文中将要讨论的,块长的适应性变化也可以要求改变正变换相位项(见方程6)及变换长度。可以用来切换块长度的基本方法将在下文中描述。

B.瞬变信号检测

图1a中框110代表的瞬变信号检测器监测输入信号振辐的快速变化,并在检测到足够大的瞬变信号时选定短的信号采样块长度。如上文所讨论的,量化误差将使离散变换编码模糊了整个信号采样块区间内瞬变信号的频谱分量。例如,比较图8a、8b和8c。在这些图中的信号图比例尺使得清楚地显示出瞬变信号前面的低水平信号。瞬变信号的最大振辐超过了图的范围,因而未显示出来。图8a给出变换编码前的原始信号。图8b给出使用512点采样块长度从非适应性块长度变换编码恢复出来的信号。瞬变信号的高频分量调制了整个块内的音乐信号,但在瞬变信号之前最明显。

在使用短信号采样块的编码中这一畸变是无害的,因为该畸变包含在较短的块中,并且在音质上被瞬变信号本身掩蔽。当瞬变信号检测器确定需要用较短的块来保证瞬变信号畸变产物有暂时音质掩蔽时,瞬变信号检测器可以选择较高的时间分辨力,其代价是由于自适应选择较短块长而使变换滤波器族的选择性变差。如图8C所示,对于本发明的一个移到256点采样块的实施例,其恢复得到的信号中瞬变信号之前的高频瞬变分量的延续时间要短于图8b所示使用512点采样块来编码的情况。

通常,在包含瞬变信号的信号采样子块内,滤波器族的选择性降低不会造成损害,因为这种较差的滤波器族性能将被瞬变信号本身所掩蔽。然而,在瞬变信号之前或之后的较短子块中编码性能的降低是可以被听出来的,所以,最大限度地减小其编码使用较短块长的时间区间是重要的。

瞬变信号检测器由四部分组成:第一部分是一个高通滤波器(HPF),它从瞬变信号检测处理过程中排除了较低频率分量。HPF是用四阶送归数字滤波器来实现的。图9给出这个滤波器的示意图,它可以表示成方程7和8所给出的一对差分方程。其等效的传递函数于方程9。

Wn=b01Xn+b11Xn-1+b21Xn-2-a11Wn-1-

a21Wn-2(7)

Yn=b02Wn+b12Wn-1+b22Wn-2-a12Yn-1-

a22Yn-2(8)

于使用1024点采样最大块长的一个本发明最佳实施例,Hl载止频率是2KHq。这个载止频率是通过听音试验建立的。出差分方程系数值和传递函数值。一个使用512个采样点最大的本发明实施例将使用截止频率为4KHq的高通滤波器(HP给出这一滤波器截止频率时的系数。

瞬变信号检测器的第二部分将高通滤波后的信号采样分段,块的层次结构子帧(hierachicol subframe)。在本发一个实施例中,使用了三级层次结构。参见图10。1024最大块长的二分之一被置于第一级。在第二级,这个二分之一样块又分段成二个子块,每个为256点采样。在第三级,这之一信号采样块分段成四个子块,每个为128个采样点。一,子块长度可表示成

Nj=>

里Nj=第j级子块的长度,

N=最大长度信号采样块的长度,

M=在该分段层次结构中的层次级别数目。

管O级没有被瞬变信号检测器所使用,但从概念上讲,它代表最度信号采样块。固此N0=N。

瞬变信号检测器的第三部分是一个峰值振幅检测器。对于在当帧内的所有层次结构级别中的每个子块,识别出具有最大振幅的采样。子块峰值振幅表示为

这里Xn=N/2采样长度的子块中第n个信号采样

j=子帧层次结构级别序号

k=在级别j中的子块序号

N=最大长度采样块的长度。

符号Pjo用来代表当前子帧中第j级第一个子块之前紧邻的前一个子帧中第j级最后一个子块的峰值振幅。参见图11。例如,在前一子帧中的P34表示成当前子帧中的P30

瞬变信号检测器的第四部分是一个阀值比较器。这一部分的第一级防止瞬变信号检测器在所通过的信号中只含有低振幅信号时改变块长度。这一功能的实现办法是:对于其峰值P11不超过一个“默阈值(Silence>s的所有信号采样块,将块长置为其最大值。这一阈值表示为

Ts=0.003Xs(12)

这里Xs=信号采样Xn的饱和值。这是一个信号采样在超出其编码表示范围之前所能得到的最大值。例如,对于24位二进制整数的二进制补码表示,其饱和值是8,388,607。

如果峰值P11不超过默阈值,则瞬变信号检测器的剩余部分被旁路。否则,如果存在瞬变信号,则比较器的第二级一个较小的信号采样块长度来适应于采样信号中存在的瞬变信号。如果首先给出一个概念性描述,会对比较器第二级和第三级所完成的处理有更好的理解。从概念上讲,第二级计算出一套该层次结构子帧的每一级相邻子块峰值振幅之比。这些比值表示成

Bjk = (Pjk)/(Pj (k - 1)) 对于K=1到2j-1 (13)

这里j=子帧层次结构级别序号

k=在第j级的子块序号

Pjk=子块峰值振幅(见方程11)。

将每个比值Rjk与两个阈值TAj和TDj相比较。TAj表示第j级的增长阈值(attack>Dj代表第j级的衰减(decay)阈值,它总是小于1。表Ⅲ给出这两个阈值之值。如果峰值振幅比向上或向下超过(Cross)了其中的一个阈值,则瞬变信号检测器选择一个较短的信号采样块长度。这个自适应过程由第三级完成,将在下面几段中描述。

比较器的第三级构成一个二进制值节点树,如图12所示。在树结构中的每个节点代表一个在当前子帧中可能被选中的一个可能的子块长度。这个树中每个节点之值由下列表达式确定:

这里j=子帧层次结构级序号,

k=第j级内的子块序号,

Rjk=子块峰值振幅比(见方程13)。

然后,修改树的节点。从树的“叶”节点开始(在本发明的最佳实施例中为第3级),对于每个等于1的节点,它的父节点和所有侧节点也都是1。

比较器第二级和第三级的实际实施与上文中的概念性描述的差别仅仅在于数学表达式的形式不同。应该承认,当Pj(k-1)为0时在方程13中表示的比值没有定义。这一问题的解决办法是避免除法,重新定义表达式14为下面的形式:

这里j=子帧层次结构级序号,

k=第j级内的子块序号,

Pjk=子块峰值振幅(见方程11)。

图13中的流程图说明了构成和修改结构树的逻辑。图14给出一个结构树在修改前和修改后的实例。

比较器的第四级从“树”上削去所有的零节点。如果该结构树只是由零节点组成,瞬变信号检测器将指出:如果可能的话帧控制器(图1a所示框114代表的)将被允许使用最大长度采样块。否则,余下的叶节点确定子块长度。对于第j级叶节点的子块长度是方程10中确定的Nj。例如参考图14,经过删简过程之后留下来的叶节点是t31、t32和t22。在本发明的最佳实施例中,这些子块中每一个的长度将是图15所示的。图16提供了为含有一个瞬变信号波形的信号段所选定的子块长度的实例。

请注意,对于使用E-TDAC变换的本发明最佳实施例,由瞬变信号检测器构成的树的叶节点所代表的子块长度之和总是等于N/2采样点数。这个总数等于每次通过瞬变信号检测器过程中向前推进的信号采样数目。因此,瞬变信号检测器只需对每个信号采样处理一次。

本领域的专家应该理解,可以使用其他瞬变信号检测器和子块长度选择方法(Scheme)而不偏离本发明的范围和精神。

再有,在下文中描述的本发明的一个最佳实施例中,是根据由本发明的瞬变信号检测器部分所指定的信号采样块长度来选择窗函数和变换类型的。窗函数或变换类型可以直接由瞬变信号特性来选择而不偏离本发明的范围或目的。

C.加窗

因为变换假定块中信号是周期性的,所以除非信号采样块被修正,否则一个离散变换将错误地造成不存在的频谱分量。参见图17。这些变换误差是由于图18所示块边缘的不连续性造成的。可以对这些不连续处进行光滑最大限度地减小这种效应。图19a至19d中以图来说明一个块如何被修正或加权,从而使块边缘附近的采样值接近于零。图19a所示乘法器电路以图19c所示加权函数来调制图19b所示的采样输入信号x(t)。结果信号示于图19d。这一过程由图1a中的框112代表。这个加权函数称作分析窗,是对信号采样块的采样点逐个相乘,它已是相当多研究工作的主题,因为它的形状对数字滤波器的性能有深广影响。例如,可参考Harris的文章“论使用离散付立叶变换进行谐合分析时窗的应用”,Proc.IEEE,卷66,1978,51-58页。简单地说,对于给定的阻带抑制水平,一个好的窗允许较陡的过渡带滚降,并允许对该窗的调制效应进行校正。下文中将更详细地讨论窗的设计。

窗的选择也受到由瞬变信号检测器选定的信号采样块长度的影响。因为编码要适应于根据瞬变信号状态而定的信号采样块长度,编码也必须选择具有适当形状和长度的分析窗。根据由瞬变信号检测器选定的信号采样块长度来选择分析窗的过程是由图1a中框114所代表的帧控制器完成的。下面将更详细地讨论帧控制器。

应该注意的是,在瞬变信号检测器要求减小块长时,为子块选择的窗可能不是最佳的,因为它可能是不对称的,也可能在它的两个边缘不趋于零。如上文所讨论的那样,使用一个欠佳(Suboptimal)的窗将会降低正变换和逆变换中的滤波器选择性。尽管如此,由于下述两个理由,还必须选择这种欠佳的窗:(1)在本发明的最佳实施例中使用的正变换和逆变换对窗的形状有一定要求,以便能消除时间域假频畸变,(2)组合分析/合成窗的形状必须保证相邻重迭窗在重迭区间之和为单位1。

对于一个给定的窗函数W(下文中将更详细讨论一个最佳窗函数),记号Wab将用于代表一个“满(full)”窗,它开始于零或接近零,在Na/2采样点之后上升到值1或接近1,在Nb/2采样点之后其值降到零或接近零。窗Wab的总长度可以表示为

len〔Wab〕= (Na+Nb)/2

这里记号Nx=在第X级的子块长度(见方程10)。如果a等于b,则窗Wab是对称的。与这一记号相一致,用于调制最大长度信号采样块的满长度窗将记为Woo。

部分窗W以零或接近零值开始,在Na/2采样点之后上升到一个等于1或接近1的终止值,该部分窗用记号Wa+表示。以1或接近于1的值开始并在Na/2采样点之后终止于零或接近零值的部分窗由记号Wa-表示。

图20中给出一组窗。窗W00是由窗Wo+和Wo-联合构成的曲线代表。窗W32是由窗W3+和W2-联合代表。

D.帧控制

图1a中的框114代表的过程是根据瞬变信号检测器的输出来控制选择分析窗和选择变换。这些过程控制处理一个信号帧所需的活动,将在下文中描述。还将简要讨论用单个FFT同时完成两个变换时的若干考虑。

1.固定帧排列(Fixed-Frame  Alignement)

在一个使用E-TDAC变换的本发明最佳实施例中,固定帧排列(FFA)不仅允许对一对满长度信号采样块同时处理变换,而且允许对子块对同时处理变换。FFA产生不变长度的帧,所以帧边界的排列是固定的或者说是同步的(Synchronous)。然而,将FFA限定到为最大信号采样块长度二分之一的选择的子块长度。所以,供FFA使用的瞬变信号检测器要比上文描述的检测器简单,其简单之处在于它的层次结构子帧只由一级构成。

图21a至21c图形表示在一个单通道系统中的一系列加窗信号采样块。块A和块B代表已由单个FFA同时变换过的两块。如果不是由于发生了瞬变信号,那么块c和块D本来也已经同时变换过了。

在图21a中给出一个瞬变信号,它出现在块C的后一半(子块Cb)和块D的前一半(子块Da)当中。编码器只需对块C和块D中这四个子块转移到N/2(512)点变换。注意,对于这些子块使用的窗与最大长度采样块使用的相同,即为Woo:用于子长Ca和Da的窗Woo的前一半是Wo+,用于子块Cb和Db的窗Woo的后一半是Wo+和Wo-是欠佳的(suboptimal),因为它们在两个边缘不趋于零。如图22a所示,使用欠佳窗会使滤波器族的选择性明显降低。虽然在含有瞬变信号的子块内较差的编码器性能一般将被瞬变信号本身所掩蔽,但在瞬变信号之前和之后的较短长度子块中这种性能降低仍可能被听到。所以,希望在瞬变状态平息之后尽可能快地恢复使用最大长度信号采样块。

用于E-TDAC抵消假频的FFA需要两个不同的相位项。图23a给出的两个相邻重迭满长度信号采样块,是在利用相邻块重迭相加以抵消时间域假频之前,从逆修正DST恢复得来的。被恢复的信号由两个分量组成:加窗的原始信号(实线)和时间域假频畸变(虚线)。假频分量是加窗原始信号的时间逆转复制品,但时间逆转发生在两个分开的区域。E-TDAC变换的相位项m(见等式1和2)控制这两个区域之间的边界位置。对于正常(normal)E-TDAC,其边界位于信号采样块的中点。所需相位项示于等式6。

图23b给出的两个相邻重迭变换块是从本发明的一个实施例在其移到较小子块长度时利用FFA恢复的。满长度块已从逆修正DCT恢复了。半长度块已从逆修正DST恢复。在DCT块中的假频分量与前述相同。但是,如果要利用相邻块重迭相加来消去假频信号,则第一个DST子块中的假频分量必须是从一端到另一端完全时间逆转的。对于所有子块都要求其假频分量是一端到另一端逆转的。适当的相位项是

m= 1/2 (16)

可以说明,相位项可写成更一般的形式:

m= (φ+1)/2 (17)

这里φ=时间逆转区域之间边界的位置。这个公式代表的情况比FFA所要求的更具有一般性,但它需要下文中讨论的其他帧控制技术。

图23c说明一个信号采样块被分成两个子块并被两个窗调制。右侧的子块和窗的长度是N/4采样点。这一子块内的两区域之间的边界位于该子块从右侧(或者说尾部边缘)算起N/8采样点处。在每个N/4采相子块区域内引起假频分量时间逆转所需要的相位项是

这里N=最大信号采样块长度。

对于图21a所示实例,一个单一的FFT能够同时处理子块Ca的DCT和子块Da的DST。类似地,单一FFT能同时处理子块Cb的DCT和子块Db的DST。能对块E和F恢复最大长度块的同时处理。

图21b所示实例只与图21a所示实例稍有不同。图21b中所示的瞬变信号在块D的后一半(子块Db)中发生。在这种情况下,由单个FFT来同时处理变换要求在一个比图21a所示情况要长的区间内使用较短的子块长度。因此,由于滤波器族选择性降低所引起的较差的编码性能要影响到较长的区间。此时可对子块对Ca/Da、Cb/Db、Ea/Fa及Eb/Fb进行同时处理DCT/DST块对。可在块G和H恢复最大长度块的同时处理。为消除假频信号E-TDAC所要求的各子块相位项与上面公式16给出的相同。

图21c所示实例与图21b所示相同,但处理顺序稍有不同。对图21c所示实例,满长度块C是单独变换的。子块对Da/Ea和Db/Eb是同时变换的。能对块F和G恢复最大长度块的同时处理,然而,现在这个块对的前一个块是进行DST变换。这一顺序允许本发明的一个实施例更快地恢复最大块长编码,然而需要一个更快的处理器,因为对块C到块下进行变换所需要的计算量比使用固定长度块同时变换的编码序列所需要的计算量大20%左右。

2.扩展的固定帧排列

本发明的一个最佳实施例使用的一种技术叫做扩展的固定帧排列(Enhanced  Fixed-Frame  Alignment)(EFA),它产生一个固定的或同步的帧排列,但允许使用的子块长度为最大信号采样块长度的2的幂次约数。在本发明的一个最佳实施例中,EFA技术可以使用的信号采样块长度为1024,512,256及128采样点。(如下文中所示,在某些限定情况下将使用64个采样点的块长。)然而,在实际情况中这个限制并不是严格的,只是因为用FFT实现离散变换时对于块长为2的幂次的情况更为有效。

在能够充分描述EFA之前,有必要引入“桥变换”(bridgetransform)的概念。桥变换是为从一个信号采样块长度向另一个采样块长度过渡来搭桥的一种变换。例如,如图24所示,假定要求本发明去处理一个N/2采样点的子块,接着再处理另一个N/4采样点的子块。这时对每个子块分别完成变换将是可能的。然而,注意到N/2采样子块要加窗W6+,而N/4子块要加窗W1-。两个窗显然都是欠佳的,会引起滤波器选择性的显著降低。例如可参见图22a。

一个桥变换通过避免使用W+j和W-j之类窗来使滤波器选择性的降低程度最小。对于图24所示实例,桥变换允许一个单一变换使用一个W01窗,而不需要两个变换各自分别使用W+0和W-1窗。从效果上讲,桥变换完成了3N/4采样长度的一个单一子块的变换。对W01窗的滤波器响应曲线示于图22b。

图24也给出了为消除时间域假频由桥变换所需要的时间逆转区域。两个时间逆转区域的边界位于含有要进行桥变换的信号采样的那两个子块的彼此边缘处。这个边界位于两个搭桥子块的右手边缘起算N/4采样点处。因此,根据公式17,对于N/2到N/4的桥变换所需相位项为

这里N=最大信号采样块长度。

图24所示单个桥变换的计算可以利用一个FFT对3个N/4长子块计算其变换,然后再进行重新组合操作。这一技术是本领域中公知的。可参见Oppenheim和Schafer的“书”数字信号处理”Engleloood  Cliffs,N.J.:Prentice-Hall,Inc.,1975,307-314页。FFT加上重组合操作也能用于同时处理两个E-TDAC桥变换。为实现同时处理所需要的预处理和后处理与Brigham和Lookabaugh针对正常满长度E-TDAC变换所描述的桥变换需要的预处理和后处理相同。然而要注意的重要一点是:在E-TDAC中的同时处理只是对于具有相同长度和相同相位项的修正DCT和修正DST才是可能的。

利用同时处理允许本发明的一个实施例采用较慢的处理器。然而,对于本发明使用ETA的单道通方案,同时处理几乎没有得到什么好处。对于使用同时处理的实施例,所选择的处理器应该能够对付最坏情况的信号瞬变事件。全部满长度块的分别变换只给处理器稍微增加了一点负担。所以,与利用EFA和同时处理来实现本发明所需要的处理器相比。利用EFA而不用同时处理来实现本发明的单通道方案只需要稍微快一点的处理器。

对于双通道系统,如果两个通道总是用同时一块长来编码,那么用同时处理是有好处的。这可以通过从同一个二进制树来为道通选择子块长度的办法实现。这个树可以通过对两个单独树的相应节点进行布尔“或”组合来构成,这里的两个单独的二进树是通过它们各自的瞬变信号检测器来处理各通信号构成的。

下文中对EFA的解释适合于本发明的单通道实施例,并假定不进行同时处理。

图26a至26f所示流程图说明了能用于控制EFA的“帧控制过程”的逻辑流程。图26a给出这一过程的全貌。其中框2600代表的初始化步骤示于图26b。这一过程的主体由四个主要部分构成。

图26c所示帧控制的第一步是设置子块长度。检查一个队列,以确定是否在瞬变信号检测器的二进制树上有任何节点尚未被处理。如果没有,瞬变信号检测器则去处理下一个N/2信号采样点,如上述方式构成二进制树,并把每个叶节点的级别放入队列。从队列中取出第一个条目,并指定为J1。这个值为“当前”子块规定了所希望的长度。符号J0代表“前一个”子块的树节点级别。如果不曾检测到瞬变信号,而且瞬变信号检测器已经指出可以使用N采样点块长,即J1=O,那么就必须测试标志“PARTIAL”(部分)以确定是否允许编码器恢复满长度处理。如果不可以,则迫使J1的取值为1,置子块长度为N/2样点。

图26d所示帧控制的第二部分确定所需分析窗长度、变换长度、及E-TDAC相位项。所选窗是Wxy,这里x是由值J0建立的,而y是由值J1建立的。变换长度和相位项的确定方式与图26b所示情况类似。

第三部分示于图26e。这一部分通过检验标志“TYPE(类型)”来选择所需变换的类型。这一个二进位标志指出是否应完成修正的DCT或修正的DST。

帧控制的第四部分示于图26f。如果J0和J1双双为零,那么便知道刚刚完成了满长度变换。于是清除“PARTIAL(部分)”和“BRIDGE(桥)”两个标志。否则,标志“BRIDGE(桥)”被触发。正在清除/触发步骤之前,这个标志指出是否曾使用过正常变换或桥变换作为当前变换。标志“TYPE(类型)”被触发,且当前子块长度J1被够入J0

如图26g所示,如果标志“BRIDGE(桥)”是清除的,则处理过程继续其第一部分,得到下一个子块长度。否则,PARTIAL(部分)标志被触发,处理过程继续其第二部分。

图25给出单通道系统中加窗信号采样块序列。所示瞬变信号发生在块C的后一半和块D的前一半中。瞬变载号检测器为这一子帧建立的二进制树示于图14。为每个子块指定的相应长度适于图15。编码器对块C的处理是首先以W03窗进行9N/16采样长度的桥变换。其次,使用W33窗完成N/8(128)采样长度的一个变换。再其次,以W32窗使用长度3N/16采样的桥变换。在块C中的剩余N/8采样留给下一个子帧,与块E的开始部分一起进行桥变换。

编码器对块D的前一半进行二个长度为N/8(128)采样的变换和一个N/4(256)采样长度的变换。一个W33窗用于两个N/8采样子块,一个W22窗用于N/4采样子块。块D的后一半用一个N/2长度变换加W11窗。在子块D使用的窗都是最佳的。

使用桥变换和非对称窗允许E-TDAC利用由公式17计算的相位项来消掉时间域假频信号。这一个采样块序列所需要的时间逆转区域及相应的相位项示于图25。

3.动态帧排列(Dynamic-Frame  Alignment)

进行E-TDAC变换的动态帧排列能够选择任意子块长度L,只要L是偶数而且大于或等于4。然而由FFT来实现的本发明实施例只使用最大信号采样块长度的2的幂次约数作为子块长度。这是因为对于变换长度为2的幂次的情况完成FFT最为有效。对于大多数情况,DFA不允许对子块对进行同时的变换处理,但DFA的确改善了编码器性能,以其允许在瞬变状态过去之后编码器立即返回最大长度信号取样块而使编码器性能超过了FFA或EFA所可能达到的编码器性能。

DFA与EFA很相似。这两种技术之间的主要区别在于:与EFA不同,DFA不限制于保持固定的或同步的帧排列。DFA可以自由地截断当前块帧并立即转回满长度信号采样块。与此相反,EFA必须保证使用适当的子块长度来结束当前帧,然后才能恢复满长度块的处理。

DFA帧控制过程只在少数几个方面与EFA帧控制不同。将参考图26a、26c及26f所示流程图来解释这些差别。第一,标志PARTIAL(部分)不象图26a中框2660所示那样被触发,而是永远是零。第二,不需要象图26c中框2611所示那样进行测试来确定树节点队列是否为“空”,因为这个队列永远是空的。第三,不象图26f中框2644所示那样触发标志BRIDGE(桥),而是永远把该标志置零。

DFA瞬变信号检测器只有一点与EFA检测器不同:对于每次重复,DFA检测器并不总是前进N/2个新采样点。假定瞬变信号检测器对当前子块选定了要转向(Shift)子块长度N/8采样,那么在处理下一个子帧之前瞬变信号检测器只前进N/8信号采样点。这样,与EFA的情况不同,DFA瞬变信号检测器可能检验一个给定信号采样不只一次。

图27给出一个单通道系统中的加窗信号采样块序列。图中给出一个瞬变信号,发生在块C的后半段。下文中的讨论假定瞬变信号检测器选择了移向长度为N/8或者说128个采样的两个子块。

编码器首先开始用W03窗长度为9N/16采样的桥变换来处理块C。块C是一个被截断的块,它以长度为N/8(128)采样的变换使用W33窗结束。长度为9N/16采样的桥变换加W30窗用于块E之中,再返回满长度块处理。

编码器用两个长度N/8(128)采样的变换来处理被截断的块D。在被截断的块D之后立即开始满长度块F。请注意块帧边界已移动了满块长的3/4。

F.系数量化和格式化

由正变换产生的频率系数一般不适于低位速率传输或有效存贮。多种量化技术可以使用,利用信号的冗余性和不相干性(irrelevancy)来减少所需位数。例如,可参考Jayant和Noll的“波形的数字编码”,Englewood  Cliffs,N.J:Prentice-Hall,Inc.,1984,563-576页。这一过程由图1a中框118代表。

如果一个信号成份能被接收器只利用信号中的其余部分便可以预测出来或提供出来,那么这个信号成份便是冗余的(redundant)。在当今技术中公知的利用信号冗余的技术有线性预测编码、自适应预测编码和熵(entropy)编码。

一个信号成份如果被略掉了确不降低所接收信号的可察觉质量,则这个信号成份是可有可无的(irrelevant)。已有技术中有几种可以利用信号的可有可无性,包括对数量化、浮点表示、以及基于频率成份量或音质掩蔽效应的自适应位分配(bit  allocation)。

格式化过程把量化的变换系数与信号采样块长度组合在一起以供传输或存贮。这一过程由图1a中的框120代表。在本发明的一个最佳实施例中,一个具体的子块长度序列由所有可能的子块长度序列表中的索引号来代表。例如,表中一个条目将代表子块长度N/2、N/8、N/8及N/4采样序列。另一个条目代表8个N/8采样子块构成的序列。

帧同步位和错误检验/纠错代码可以使用,供格式化数据传输时需要。数据库指针或关键字可以加入,供格式化数据存贮时需要。现在格式化帧已经准备好,可以沿图1a所示路径122传送或存贮。

DFA技术给信号格式化增加了更大的复杂性。DFA格式化的一个优选方案是利用循环缓存区。当代表变换系数的适当数量的数据位与附加信息已经放入缓存区时,那些数据可以是格式化的,加上帧同步位,然后传输或存贮。这允许格式化帧有一个不变长度。固此,使用DFA时的格式化帧不再等效于变换块帧。DFA格式化帧不保证含有相同数量的变换块。固此,由解码器接收的变换块长度信息的准确性是至关重要的,因而应该采取某种办法(例如几余代码或错误校正代码)来加以保护。变换块长度信息出错会使解码器不能对那个变换块及随后的所有块进行适当的解码,直到重新建立变换块同步为止。

G.格式解析和系数线性化

信号通道132或者接收被传送来的信号或从存贮器取出信号,当这样接收到数字化的编码信号时,便开始了格式解析(deformatting)过程。格式解析过程由图1b中的框134代表。格式解析过程提取解码器使用的量化变换系数和信号采样块长度。利用在编码器中对系数进行量化过程的逆过程来改变换系数转换成线性表示形式。这一过程由图1b中框136代表。线性采样块长度用于选择适当的合成窗函数和设置逆变换长度。

H.合成滤波器族-逆变换

图1b中框138代表一族合成滤波器,它们将格式解析和线性化处理所恢复的频率域系数变换时间域信号采样块。图1a中的分析滤波器族116所用变换的逆变换实现了合成滤波器族138。本发明的这一实施例中使用的E-TDAC技术采用的逆变换是交替应用修正的逆DCT和修正的逆DST。每个变换的长度设置成等于从格式化信号中提取出来的每个信号采样块长度。所需相位项的计算采用的处理过程与上文描述的本发明编码器部分使用的相同。

因为变换系数中有一半从传输或存贮中略掉了(见表达式3和4),所以必须为逆变换重新建立那些系数。失掉的DCT系数可以从所能得到的DCT系数按公式19所示重新建立。失掉的DST系数可以按公式20所示重新建立。逆修正的DST由公式21表示,逆修正DST由公式22表示。

C(k)=-C(N-k)  对N/2≤k<N  (19)

S(k)=-S(N-k)  对N/2<k≤N  (20)

对O≤k<N(21)

对O≤k<N(22)

这里  k=变换系数序号,

n=信号采样序号,

K=变换系数总数,

N=采样块长度,

m=E-TDAC所用相位项(见公式6),

C(k)=量化的第k个DCT系数,

S(k)=量化的第k个DST系数,

X(n)=恢复的量化信号x(n)。

图4a-4e及6a-6g说明了分析-合成滤波器族的变换过程。分析滤波器族将时间域信号变换成交替出现的DCT和DST块序列。逆变换对每隔一个块应用逆DCT,而对这些块中的另一半应用逆DST。如图5a-5d所示。所恢复的信号中含有假频畸变。这一畸变是在其后进行的时间域块重迭一相加过程(图1b中框144代表这一过程)中被消去的。下文中讨论这一重迭一相加过程。

逆变换的计算是由FFT算法完成的。在逆变换中采用了正变换中使用的同样技术,以允许使用单个FFT同时计算一对逆修正DCT和逆修正DST。

图1b中框140所代表的帧控制过程控制子块对的排列及逆O-TDAC变换为消除时间域假频信号所需相位项的选择。这一过程与本发明编码器部分使用的帧控制过程相同。

I.合成窗

图6a-6g说明了通过对相邻时间域信号采样块进行重迭-相加来消除时间域假频信号的过程。正如Princen导出的那样,为消除时间域假频畸变,E-TDAC变换要求应用一个与分析窗完全相同的合成窗并进行相邻块的重迭-相加。每个块重迭100%;50%被前一块重迭,50%被后续块重迭。图16中框142代表了合成窗调制过程。分析窗和合成窗的设计必须满足下列条件:当相邻的乘积窗被重迭时,该分析-合成乘积窗总是相加为单位1。这个重迭一相加过程由图1b中的框144代表,并示于图6a-6g。分别从逆DCT和DST恢复的信号Ya(t)和Ys(t)示于图6a和6d。每个信号被分成一系列块。每个信号块被图6b和图6e所示合成窗函数调制。结果生成的信号块Yc(t)和Ys(t)示于图6c和6f。以二分之一块长度重迭的两个信号相加,产生出信号Y(t),示于图6g。信号Y(t)是原始输入信号的精确重建。

如图28所示,在块k和块k+1之间的重迭区内某些时刻not上的信号采样是由这两个块的每一个中的采样来代表的。在两个加窗块重迭-相加之后,可以看到在时刻not处的恢复信号采样为取自加窗块k和k+1的采样之和,它可由下式表示:

x(not)=WPk(not)·x(not)+WPk+1(not)·x(not)

(23)

这里WPk(not)=WAk(not)·WSk(not)=(WAk(not))2

WAk(not)=块k中在时刻not的分析窗,

WSk(not)=块k中在时刻not的合成窗,

WAk(not)=WSK(not),这是E-TDAC变换所要求的。

如果两个相邻乘法窗在其窗重迭区间之和等于单位1,则乘法窗的调制效应被抵消。所以,如果对块k和块k+1之间的重迭区间内所有时间采样,满足

WPk(nt)+WPK+1(nt)=1,>

则信号x(nt)可以被精确恢复。

虽然具有适当的重迭-相加性质的任何窗都可用作导出分析-合成窗对的基础,但在本发明的一个最佳实施例中使用的窗是从Kaiser-Bessel窗导出的,其α值在4至7范围内。参见公式25。

  对O≤n<N(25)

这里α=Kaiser-Bessel  α因子,

n=窗采样序号,

N=以采样点数表示的窗长度,

窗的导出是用一个长度等于块长减重迭区间的矩形窗与一个Kaiser-Bessel窗进行褶积。参见公式26。这一公式可以简化成公式27。

  对O≤n<N  (26)

 对O≤n<N  (27)

n=乘法窗采样序号

V=窗重迭区间内采样数,

N=乘法窗的预期长度,

W(n)=长度为V+1的开始窗函数,

WP(n)=长度为N的导出乘法窗,

对O≤K<N-V

其他情况

对于使用E-TDAC变换的本发明最佳实施例,分析窗和合成上面导出的乘法窗WP(n)取平方根得到的。分析和合成窗有长度1024、512、256和128采样点,有100%窗或N/2采样)。分析窗函数示于公式28。

 对O≤n<N  (28)

N∈(128,256,512,1024),

W(n)长度为N+1的Kaiser-Bessel函数;α因子取质范围是4至7。

J.信号输出

图1b中框146代表一个常规的数-横转换器,它响应数字输入,产生一个可变电压横拟信号。数字信号取自重迭-相加过程产生的24位整数字的16个最高有效二进制位。横拟输出应由一个通带宽度为15KHz(对20KHz编码器为20KHz)的低通滤波器来滤波。该滤波器示于图1b中的框148。所恢复的适于放大的声音信号可以图1b中所示输出终端150得到。

Ⅱ.本发明的另一个O-TDAC实施例

本发明的另一个实施例利用的变换称作“奇迭时间域抵消假频(Oddly-Stacked  Time-Domain  Aliasing  Cancellation)(O-TDAC)。下面的描述讨论本发明的E-TDAC和O-TDAC方案在实现中的差别。

A.正变换

O-TDAC利用的变换函数是修正的离散余弦变换(DCT),示于等式29。

  对O≤K<N

这里k=频率系数序号,

n=输入信号采样序号,

N=采样块长度,

m=O-TDAC所用相位项(见等式6),

x(n)=输入信号x(t)在采样n的量化值,

C(k)=第k个DCT系数。

O-TDAC变换产生一组谱系数或变换块,其形式是:

对于O≤k< (N)/2 (30)

对于k= (N)/2

这里i=信号采样块序号,

C(k)=DCT系数(见等式29)。

所用的计算算法是快速付立叶变换(FFT)。与E-TDAC方案不同,O-TDAC的实现不能用单一FFT来同时变换两个信号采样块。然而,利用与E-TDAC方案中采用的“先乘-变换-后乘处理”相类似的技术可以把变换的复杂性从N2减小为N·logN3计算。前乘步骤将信号采样x(n)的实数值序列转变成一个复数,其值序列是用复数函数

来乘信号采样点。这里,

j=-1,

n=输入信号采样序号,

N=采样块长度。

由FFT实现的离散付立叶变换将修改过的信号采样转换成一组变换系数。因为FFT是复数变换,修正过的信号采样组的实部和虚部能被同时变换。最后,后乘(Postmultiply)步骤得到DCT系数。这一过程由下面的等式32和33表示:

C(k)=R(k)cos〔2π(k+ 1/2 ) (m)/(N) 〕+Q(k)sin〔2π(k+ 1/2 ) (m)/(N) 〕

(33)

这里j=-1,

n=输入信号采样序号,

N=采样块长度,

k=频率系数序号,

m=O-TDAC的相位项(参见等式6),

R(k)=系数X(k)的实部,

Q(k)=系数X(k)的虚部,

C(k)=第k个DCT系数。

在本发明的单通道方案最佳实施例中,每个信号采样块用FFT分别变换。一个块构成一帧。在双通道系统中,从两个通道中的每一个得到的信号采样块由FFT处理变换的DCT1/DCT2块对。这个块对构成一帧。

Princen指出适当的相位分量m(见式b)和精心设计的分析-合成窗对,O-TDAC技术能从形如

{C(K)}0,{C(K)}1,{C(K)}2

{C(K)}3,……>

的一组余弦变换块精确地恢复输入信号。

O-TDAC变换和假频信号消除过程与E-TDAC变换的情况很相似,这一过程示于图29a-29e、30a-30d及31a-31g。其主要区别是假频信号分量的形式。对于采样信号块的前一半,假频分量是输入信号相对于采样编四分之一点处的时间逆转图象,但它的振幅的符号与输入信号的符号相反。对于采样信号块的后一半,其假频信号是相对于采样块四分之三点的时间逆转,而其符号不变。参见图30b和30d。

分析窗和合成窗的设计和使用都与E-TDAC的情况完全相同。参见图31a-31g。上文中对E-TDAC讨论的帧排列技术在这里也同样有效。

在O-TDAC中使用适应性信号采样块长度时,与E-TDAC的情况所需要的考虑相比,并不需要再作其他额外的考虑,只是FFA技术所用的变换相位项的选择这一点除外。图32中给出消除假频信号所需要的相位项,图中显示出信号采样块为C至E,这是由逆O-TDAC变换恢复而来的一组三个重迭的满长度变换块。根据FFA技术,块D和E已被分段成为子块。

为了利用重迭-相加来实现假频信号的消除,在子块Da和Do中的假频分量必须在时间上逆转,并且其振幅要从加窗原始信号那里翻转得来。请注意,在图31a中这一逆转/翻转特性是对于O-TDAC在左手区由假频分量产生出来的。所以,逆转区之间的边界必须放在该子块右手边缘处。由式17,我们知道子块Da和Ea所需相位项是

m= 1/2 (35)

在子块Db和Eb中的假频分量只是在时间上逆转。这一特性对O-TDAC是在右手区表现出来的。所以,逆转区之间的边界中必须放在该子块的左手边缘。根据式17,所需相位项应是

这里N=最大信号采样块长度。

对于O-TDAC使用FFA的确定相位项的一般规律如下。对于每个满长度块中的第一子块,其变换使用的相位项如式35所示。对于所有的满长度块以及在每个满长度块中的第二子块,其相位项如式36所示。

B.逆变换

DCT系数中有一半从传输或存贮中略掉,然后利用式37所示关系从所能得到的DCT块中重新建立起来。逆修正DCT示于式38。

C(k)=-C(N-k)  对N/2≤k<N  (37)

对O≤n<N  (38)

这里k=变换系数序号,

n=信号采样序号,

K=变换系数数,

N=采样块长度,

m=E-TDAC的相位项(见式6),

C(k)=第k个量化DCT系数,

X(n)=恢复的量化系数X(n)。

在应用O-TDAC实现逆变换时,利用与正变换中使用的相类似的“前乘-变换-后乘”处理,使计算复杂性从N2减少到N·logN2。这一过程将实数值DCT系数变成一组修正的复数值系数,利用逆FFT同时变换修正系数的实部和虚部(IFFT),再从“后乘”得到时间域信号,如下列等式所示。

X(n)=IFFT{C(k)e-j2π>

X(n)=r(n)COS〔π (n+m)/(N) 〕-q(n)Sin〔π (n+m)/(N) 〕

对O≤n<N  (40)

这里j=-1,

m=O-TDAC的相位项(见式6),

N=采样块长度,

k=频率系数序号,

n=输入信号采样序号,

r(n)=采样X(n)的实部,

q(n)=采样X(n)的虚部,

X(n)=恢复的量化信号X(n)。

其后进行的加窗、重迭-相加、及信号输出处理与上文中描述的本发明E-TDAC实施例的情况完全相同。

C.自适应使用E-TDAC和O-TDAC变换

由上面的讨论,一个熟悉本门技术的人应该理解,自适应地在E-TDAC和O-TDAC之间进行选择也是可能的,选择分析窗和合成窗的过程与上面描述的相同。为消除时间域假频信号所需的相位项的计算也将遵循上面讨论的相同原则。

变换选择可以用来改善瞬变信号的编码器性能或为其他感兴趣的信号特征来改善编码器性能。例如,通过在这两个TDAC变换之间来回改变,编码器/解码器系统能借助自适应地移动频率仓的中心频率来改善单调(single-tone)信号的编码。这是可能的,因为对这两种变换各自的频率仓带宽有差异。如图33a所示,E-TOAC变换仓零(直流分量)和仓N/2有带宽等于所有其他仓带宽的二分之一。然而,对于O-TDAC变换,每个频率仓是等间隔的。见图33b。在本发明的一个最佳实施例中使用1024采样点的块长,采样率为44.1KHq,有可能例如将仓1的频率从21.5Hq移到43Hq,这只需从E-TDAC变换转移到O-TDAC变换就可以实现。

Ⅲ.本发明的另一种DFT实施例

对于大多数应用,E-TDAC是最佳选择,然而,E-TDAC编码器所需信号处理资源(resources)比以离散付立叶变换(DFT)为基础的编码器所需资源要多。使用DFT实现编码器需要较少存贮器和较低处理速度。本发明的DFT实施例的基本结构与图1a和图1b所示相同,只是没有使用合成窗调制器142。

下面的描述讨论了本发明的DFT变换方案和E-TDAC变换方案的区别。

A.瞬变信号检测器和帧控制

上文中描述的关于E-TDAC实施例的瞬变信号检测器逻辑在概念上与DFT实施例的相同,只是其检测器分析整个块的采样而不是只分析半个块的采样。固此,帧控制过程尽管在概念上与E-TDAC的相似,但一次选择各子块长度是针对一个满长度块,而不是只对半块子帧长度来选择各子块长度。

B.加窗

因为E-TDAC变换与DFT变换之间的差异,其分析窗与E-TDAC编码器使用的分析窗不同。选择一个能减少输入信号采样块重迭量的窗设计是很重要的,因为DFT不是临界采样的,也就是说,对于重迭区间的信号采样,其传输速率或数据存贮量都是要加倍的。使用100%重迭的分析窗会使DFT编码器需要将近两倍于E-TDAC编码器所需的位速率。

这样,在本发明的一个DFT实施例中使用的满长度块优选窗显示出在大区间上有一倍增益,从而把块重迭长度由N/2(512)采样减小到16个采样。这一减小降低了数字滤波器的阻带抑制水平,但与E-TDAC编码器的情况相比它只引起数据速率的适度增加。

从DFT窗族中导出一个窗的方式与E-TDAC实施例中导出汞积窗WP(n)所用方式类似。对于DFT实施例,核(Kernel)Kaiser-Bessel函数长度为17采样点,其α固子之值在1.5至3范围内。参见式25。DFT分析窗是由Kaiser-Bessel窗与一个矩形窗被积得到的。对于窗W00,该矩形窗的长度是1008采样点(块长1024点减去重迭区间的16个点)。类似地,对窗W33其矩形窗的长度是112采样(或者说128-16)。将这些值代入式27,得到的这两个窗函数是:

这里W(n)=Kaiser-Bessel函数,其长度为17采样点,其α因子取值区间是1.5至3。

C.分析滤波器族-正变换

DFT实现其滤波器族,表达式是:

对O≤n<N  (43)

这里j=-1,

k=频率系数序号,

n=输入信号采样序号,

N=信号采样块最大长度,

x(n)=输入信号x(t)在采样点n处的量化值,

X(k)=第k个变换频率系数。

D.合成窗族-逆变换

DFT实现其逆滤波器族,表达式是:

  对O≤K<N  (44)

这里j=-1,

k=频率系数序号,

n=输入信号采样序号,

N=信号采样块最大长度,

x(n)=在采样点n处的恢复的最化信号x(t),

X(k)=第k个变换频率系数。

E.合成窗

如上所述,DFT不需要使用合成窗。

F.其他变换

可以使用任何正交变换而不偏离本发明的精神和目的。利用上面对于DFT所讨论的各种考虑,根据瞬变信号的存在或任何其他信号特性来自适应地选择任一正变变换也是可能的。例如,本发明的一个实施例可以在正常情况下使用式45所示通常DCT,但选择式46所示通常DST来编码含有瞬变信号的子块。其逆DCT和逆DST分别示于式47和48。

这里K=频率系数序号,

n=输入信号采样序号,

N=最大信号采样块长度,

x(n)=输入信号x(t)在采样点n处的量化值,

X(k)=第k个变换频率系数,

  对<>0

1  否则。

表:

a1ja2j

ai1-1.641731>

ai2-1.809110>

b0jb1jb2j

bi10.830277>

bi20.941365>

表Ⅰ

2KHz高通滤收器系数

a1ja2j

ai1-1.266438>

ai2-1.517035>

b0jb1jb2j

bi10.671333>

bi20.852569>

表Ⅱ

4KHz高通滤收器系数

比值阀

子帧级别号 子块长度 TAjTDj

1  512  5.0  0.2000

2  256  10.0  0.1000

3  128  13.3  0.0752

表Ⅲ

瞬变信号检测器增大-衰减阀值

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号