首页> 中国专利> 采用加权信号量化位分配进行数据压缩的装置和方法

采用加权信号量化位分配进行数据压缩的装置和方法

摘要

一种压缩数字输入信号以产生压缩的数字输出信号的设备和方法,该设备包括:一个装置,用于从数字输入信号中导出多个频谱系数并将其分为分别具有频带值和频带频率的多个频带;一个自适应位分配装置,用于自适应地在频带间分配若干与信号相关的量化位,从而对各频带分配若干用于量化频带中每一频谱系数的与信号相关的量化位,分配给各频带的与信号相关量化位的数量由按频带频率加权处理的频带值确定。

著录项

  • 公开/公告号CN1078832A

    专利类型发明专利

  • 公开/公告日1993-11-24

    原文格式PDF

  • 申请/专利权人 索尼公司;

    申请/专利号CN93101716.5

  • 发明设计人 筒井京弥;赤桐健三;

    申请日1993-01-29

  • 分类号H03H17/02;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人程天正

  • 地址 日本东京

  • 入库时间 2023-12-17 12:23:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-03-27

    专利权有效期届满 IPC(主分类):H04B1/66 授权公告日:19991117 期满终止日期:20130129 申请日:19930129

    专利权的终止

  • 1999-11-17

    授权

    授权

  • 1995-05-24

    实质审查请求的生效

    实质审查请求的生效

  • 1993-11-24

    公开

    公开

说明书

本发明相关于对数字信息信号进行压缩的装置,其中数字输入信号是采用自适应位分配来压缩的。

众所周知,有多种压缩数字音频或声音信号的技术。例如,子带编码,一种非块状频带划分系统,其中输入的音频信号不是按时间被划分为块,而是用一个滤波器将其按频率分为多个频带来进行量化。在一个块状频带划分系统中,如一个变换编码系统中,通过一个正交变换将时域中的输入音频信号较换为频率域中的频谱系数。所产生的频谱系数被分为多个频带,并对每个带中的频谱系数进行量化。还有一种已知的技术,它包括子带编码和变换编码的组合,其中通过按频率划分输入音频信号所产生的频率域信号被分别正交变换为频谱系数。该频谱系数随后被分为多个频带并且在各个频带中进行量化。

可用于将一个数字音频输入信号分为多个频带的滤波器是正交镜象(QMF)滤波器,该滤波器在例如R.E.Crochiere,Digital    Coding    of    Speech    in    Syb-bands,55    BELL    SYST    TECH    J.NO.8(1976)中作过描述。将音频输入信号按频率划分为具有相等宽度的频带的技术在Joseph    H.Rothweiler,Polyphase    Quadrature    Filers-a    New    Sub-band    Coding    Technique,ICASSP83,BOSTON(1983)中作了讨论。

在进行正交变换的技术中,人们知道要将数字音频输入信号按时间划分为具有预定间隔的预定数量采样块,并采用快速付立叶变换、 离数余弦变换或改进的离散余弦变换(MDCT)来处理每一块,从而将时域中的信号转换为频率域中的一个信号。在J.P.Princen    &    c    A.B.Bradley,Sub-Band/Transform    Coding    Using    Filter    Bank    Designs    Based    on    Time    Domain    Aliasing    Cancellalion,ICASSP    1987(1987)中可找到对MDCT的描述。

作为量化由频率划分所获得的相应的频谱系数的技术,人们已知一种考虑了人类的听觉特征的子带系统。音频信号可按频率划分为多个频带,例如25个临界频带,其带宽随频率增大而增加。当每个相应频带中的频谱系数被量化时,通过作用于每个频带上的自适应位分配来量化频谱系数。例如,当量化由MDCT所产生的频谱系数时,该频谱系数被分为多个频带,并且采用一个自适应确定的位数在每个频带中对频谱系数进行量化。

对已知的自适应位分配技术,我们将讨论两种。第一;在ASSP-25,IEEE    T    RAASACTIONS    OF    ACOUSTICS,SPEECH,AND    SIGNAL    PROCESSING    NO4.August1977中所描述的技术中,位分配是在相应频带的信号的幅值基础上进行的。虽然这一系统换供一个平滑的量化噪声频谱以及最小的噪声能量,但由听众所实际接收的噪声并不是最小,因为这一技术没有利用人类听觉的掩蔽特性。

另一方面,在M.A.Kransner,The    Critical    Band    Coder-Digital    Encoding    of    the    Perceptnal    Requicements    of    the    Auditory    Sustem,ICASSP    1980中所描述的技术采用人类听觉的掩蔽特殊来确定每个频带进行一个固定量化位分配时所需的信噪比。然而,由于位分配保持固定,因此这一技术提供具有一个单一正弦波输入的相对较差的结果。

在上面所讨论的分配技术中要克服上述缺点,可参考美国专利申请序列No.07/924,298中所描述的数据压缩装置。在这一装置中,用于量化由一个正交变换所产生的所有频谱系数的总位数在根据固定位分配模式进行分配的位和根据可变位分配模式进行分配的位之间进行划分。量化每个频带中每个频谱系数所分配的总倍数是根据固定位分配模式分配给频带的位数与根据可变位分配模式分配给频带的位数之和。量化位的总数在固定和可变位分配模式之间的划分比率是可变的,它依赖于相关于输入信号的一个信号,即,信号频谱越平滑,那么固定位分配的划分比率就越大。对每一块数字音频输入信号而言,根据固定位分配模式在每个频带中分配来量化每一个频谱系数的位数是固定的,而根据可变位分配模式在每个频带中分配来量化每一个频谱系数的位数依赖于每一频带的频带值。频带值可以是频带的任一能量,频带的峰级、频带的平均级或与该频带相关的一些其它合适的参数。

如果输入信号的能量集中在特定的频谱区域,如一个单一正弦波输入,刚才所描述的量化位分配技术使得分配给包含有高频谱能量级的频带的位数增加,从而改进了总的信噪特性。由于人类的听觉通常对包含有窄频谱元素的信号有高灵敏度,因此上述位分配技术不仅改进了信噪比的测量值,而且也改进了由人类听众所接收的信噪比。

然而,如果与信号相关的位分配仅仅以改进信噪特性为目的的话,那么在一个包含有大量窄频谱成份的信号中大量的位比特就不能分配给相应于频谱区域的频带中,如三角声波。对于这样一种信号需要通过刚才所描述的位分配技术来改进声音质量。

本发明的目的是提供一种数据压缩设备,该设备能提供对一种数 字音频输入信号的高度压缩,并且能提供一个压缩信号,该信号在经过展开、译码和重现之后,具有的被听众接受的声音质量,即使当该信号中包括了大量的窄频谱成份时也是如此。

因此,本发明提供一种数字压缩设备,用于压缩一个数字输入信号以提供一个压缩的数字输出信号。该设备包括一个装置,该装置由数字输入信号导出多个频谱系数,并按组将该频谱系数划分到各频带上。该设备还包括一自适应位分配装置,该装置在频带间分配多个与信号相关的量化位,从而向每一频带分配一定量的与信号相关的量化位,用于在该频带上量化每组频谱系数。分配给每一频带的与信号相关的量化位的数量是根据由频带频率加权的频带的值确定的。

采用本发明的数据压缩设备,用于位分配的总的位数被分配给固定位分配模式和可变位分配模式,对前者而言,位的数量对每一个暂的时间间隔是预先固定的,而对后者而言,位分配是根据块间的信号幅值来进行的。此外,不仅固定位分配模式,而且与块间信号幅值相关的可变位分配模式,都是通过从该块的一个频率范围到另一频率范围加权而得到的。

当对一给定频带能量分配给较低频率带的与能量相关的量化位的数目增加时,执行与频带频率相关的加权量有效,这是因为处于较高频率的噪声,由于人类的听觉机理特性以及由于处于较高频率的噪声会被低频信号掩蔽,因而不易听到。

因此,要这样设计自适应位分配装置,使得对同样信号能量有更多位被分配到较低的频率带,从而可执行上面提到的对每个频带位分配的加权。

根据本发明的设备此外还包括一个固定位分配装置,根据一个固 定位分配模式定义:对每一频带分配一定量的固定模式量化位来量化每一频带上的频谱系数,该固定位分配装置将固定模式量化位的数量在频带之间进行分配。该设备还可以包括一个量化装置,它利用一些量化位对每一频带上的频谱系数进行量化。量化位的数目等于分配来量化频带上的每一组频谱系数的与能量相关的量化位的数目与分配来量化频带上的每一组频谱系数的固定模式量化位的数目之和。

虽然根据固定分配模式分配的位数与根据与信号相关的位分配模式分配的位数的比值可以是固定的,但如果响应输入信号来变化这个比值,就可以进一步改进声音的质量。

因此,根据本发明的数据压缩设备可以提供量化所有频谱系数所需的全部量化位的数目,此外还包括一个划分比率确定装置,它确定量化位总数量在与能量相关的量化位数目和固定模式量化位数目之间的量化位。

由听众所感觉的声音质量可以通过提供多种加权模式并且响应输入信号选择一个适当的加权模式、或者响应输入信号逐渐改变加权变量来进一步改进。

最后,根据本发明的数据压缩设备可以存贮多个与频率相关的加权模式,并响应数字输入信号进行选择,从而提供给自适应位分配装置一种给选择的与频率相关的加权模式,即从所存贮的与频率相关的加权模式中选择一个合适的。另外,自适应位分配装置可以用与数字输入信号和频带的频率相关的一个加权系数来对每一频带的能量加权。

在本发明的数据压缩器中,分配来量化每一频带上的频谱系数的与信号相关的量化位的数目是由频带值确定的,它根据频带频率进行加权从而更有数地进行量化位分配并适应人类的听觉。利用这一技术可以改进声音的质量,特别是对具有多个窄长频谱成份,甚至处于低位速率的输入信号更是如此。

在根据本发明来压缩一个数字输入信号以提供一个压缩的数字输出信号的方法中,由数字输入信号导出多个频谱系数,并组成多个频带;若干与信号相关的量化位数在频带间进行自适应分配,从而给某一频带分配若干与信号相关的量化位来量化该频带中的每个频谱系数。分配给每个频带的与信号相关的量化位的数量,据根频带值来确定,该频带值根据频带频率作过加权。

根据本发明的一个媒体,其中存贮了由一种数据压缩方法从一个数字输入信号中所导发的一个压缩数字信号,在所述数据压缩方法中,从数字输入信号导出多个频谱系数,并将其按组分到多个频带中,若干与信号相关的量化位的数目在频带间进行分配,从而给每一频带分配若干与信号相关的量化位数目来量化该频带的每一频谱系数。分配给每一带的与信号相关的量化位的数目由根据频带频率进行加权处理后的频带值决定。在每个频带中的每个频谱系数采用若干数量的量化位进行量化。该若干数量的量化位个包含若干分配来量化频带中每一频谱系数的与信号相关的量化位数目。量化后的频谱系数包含在压缩的数字信号中。

根据本发明的一个扩展器展开由一种数据压缩方法从一个数输入信号中导出的一个压缩数字信号,在该数据压缩方法中,从数字输入信号中导出多个频谱系数,并将其按组分到频带中,若干数量的与信号相关的量化位在频带间进行自适应分配,从而给每一频带分配若干与信号相关的量化位来量化频带中的每一频谱系数。分配给每一频带的与信号相关的量化位的数目是由按频带频率加权后的频带值决定的。 各频带中的每一频谱系数采用若干数量的量化位进行量化,该若干数量的量化位中包含分配来量化频带中每个频谱系数的若干与信号相关的量化位的数量。量化后的频谱系数和指示每一频带的量化位的数量的数据被包含在压缩数字信号中。扩展器包括一个装置,对每一频带该装置从压缩数字信号中分离出量化频谱系数和指示量化位数目的数据。该扩展器通还包括一个装置,对每一频带响应指示量化位数目的数据将量化的频谱系数转换为连续量。最后,该扩展器包括一个从转换为连续量的频谱系数中导出输出信号的装置。

图1是一个方框电路图,它示出了实施本发明的一个数据压缩设备的典型结构。

图2是用于解释在图1所示的数据压缩设备中输入信号的频率和时间划分的示意图。

图3是一个方框电路图,它示出了图1所示数据压缩设备的自适应位分配和量化电路的结构。

图4A至4D示出了四种不同加权模式的频率响应曲线。在这些曲线中,以对数尺度表示的频率画在X轴,以分贝为单位的电平画在Y轴。

图5示出了一个Bark频谱图,其中以对数分度表示的频率绘在Y轴,以分贝为单位的电平绘在Y轴。

图6示出了包含窄频谱成份的一个输入信号的频谱图,其中以对数分度的频率绘在X轴,而从分贝为单位的电平绘在Y轴。

图7是用于解释用图1所示的数据压缩设备对图6中的轴入信号进行位分配的示意图。其中以对数分度的频率绘在X轴,而比特位的数据绘在Y轴。

图8是一个方框电路图,它示出了实施本发明的一个辅助数据扩展器的典型结构。

下面结合附图来该细描述本发明的一个示例性实施例。

图1所示的数据压缩设备适用于压缩由自适应位分配提供给输入端10的一个数字音频输入信号,该设备包括自适应位分配和量化电路16至18,由此可用以在频带间进行分配的全部的量化位数量在根据一种固定位模式进行分配的位和根据一种可变位模式进行分配的位之间划分。对将输入信号按时间进行划分每一块而言,在将输入信号按频率进行划分的每一频带上,根据固定位分配模式分配一固定数量的位,以及依赖于每一频带的带值分配可变数量的位。可变位分配是依非每一频带的频率来加权而实现的。

较高频率的噪声较于在较低频率的噪声更不容易由人的听觉感知。这与人的听觉频率响应特性有关,而且还因为较低频率的信号倾向于掩蔽较高频率的信号(或噪声)。因此,通过加权使得对一给定的能量水平而言,分配给较低频率带的位数有所增加,这种加权才是更为有效的。由于可得到的量化位的数目是固定的,增加分配给较低频率带的位的数目实际上就减少了分配给较高频率带的位的数目。

因此,可以这样来设计自适应位分配和量化电路16至18,使得位分配根据频带的频率进行加权,从而,对一给定信号能量来说,分配给较低频率带的位数比分配给较高频带的位数要多。

根据本发明,根据一种固定位分配模式分配的位的数目与根据一种可变位分配模式来分配的位的数目的比率可以是固定的,也可以与输入信号相关。如果使比率相关于输入信号可以改进声音的质量。

因此,可以通过自适应位分配和量化电路16至18,从与输入信号相关的,根据一个固定位分配模式分配的位数与数据一个可变位分配模式分配位数之比来进行位分配。

通过提供多种加权模式,并且根据输入信号来选择一个适当的加权模式,或者根据输入信号逐渐改变加权因子,位分配会更加与人的听觉特别协调一致,从而更一步改进声音质量。

因此,自适应位分配和量化电路16至18可以进行位分配,对每一输入信号块而言,该位分配相关于每一频带的加权频带幅值,该频带幅值反过来又相关于与每一频带的频率有关的加权因子,它采用能根据输入信号进行变化的加权系数。

参图见1,这是一个数据压缩设备的实施例,其中一数字输入音频信号,诸如一个PCM音频信号,被采用子带编码,自适应变换编码和自适应位分配技术进行压缩,现在将对该实施例进行描述。图1所示的电路可以采用数字逻辑芯片来构成,也可以采用一个合理编程的微处理器及相关的存贮器来实现。该电路也可以采用一种合理编程的数字信号处理器芯片和辅助存贮器来构成。

在图1所示的数字压缩设备中,用一个滤波器将一个数字输入音频信号按频率分为多个频率范围,在每一频率范围中的信号在时域中被划分为多个块,并且每个频率范围信号的每一块被进行正交变换以提供多个频谱系数。在频率域中所产生的频谱系数被按组分配到频带中,每一频带中的频谱系数被自适应位分配进行量化,其中,在自适位分配中对量化位进行分配从而量化每一频带中的频谱系数。

另一方面,可采用合适的滤波器来产生频谱系数,将输入信号按频率划分为多个窄频率带,而不是按时间来划分输入信号。

频谱系数最好组成临界频带,该临界频带考虑了人类的听觉特征。 名词“临界频带”表示由一个考虑了人类听觉的频率鉴别特性的频率划分系统所产生的一个频率带。一个临界频带是一个噪声频带,它可以被一个与该噪声频带具有相同的强度,频率取该噪声频带的中间值的纯净声音所掩蔽。临界频带的宽度随频率的增大而增加。OHE至20KHE的音频频率范围通常被划分25个临界频带。

在所示出的实施例中,将输入信号按时间所划分的各块的大小或块长度在正交变换之前响应输入信号进自适应地变化,对每个频率范围信号的每一块,在该块进行正交变换之前,可以作块浮动。此外,块浮动可适用于每一临界频带中的频谱系数,以及适用于将较高频率临界频带按频率划分所得到的子带。

参照图1,举例来看,在OHE至20KHE频率范围内的一个PCM数字音频输入信号被施加到输入端10,该输入信号被频带划分滤波器11-最好是一个正交镜象(OMF)滤波器-划分为OHE至10KHE频率范围内的一个频率范围信号在10至20KHE频率范围的一个高频范围信号。在OHE至10KHE频率范围内的频率范围信号进一步被频带划分滤波器12-最好也是一个QME滤波器-划分为在OHE至5KHE频率范围内的一个低频信号在5至10KHE频率范围内的一个中频范围信号。

来自频带划分滤波器11中的10KHE至20KHE频率范围信号被馈入到正交变换电路13-该电路最好是一个改进的离散余弦变换(MDCT)电路-和块大小确定电路19。来自频带划分滤波器12中的5KHE至10KHE频率范围信号被馈入MDCT电路14和块大小确定电路20。来自频带划分滤波器12中的OHE至5KHE频率范围信号被馈入MDCT电路15和块大小确定电路 21。要使MDCT进行处理的块大小在每个块大小确定电路19、20和21中确定。来自频带划分滤波器11和12的频率范围信号,采用由块大小确定电路19、20和21提供的块大小数据所指示的块大小,通过MDCT电路13、14和13来进行MDCT处理。

图2示出了由MDCT电路13、14和15所采用的块大小的一个实例,其中在沿频率增大的方向频率范围变宽,并且时间分辩率增加(即块长度变短)。当在低频率范围信号(OHE至5KHE)和中频率范围信号(5至10KHE)的块bL、bM上分别进行一个MDCT操作的同时,在高频率范围信号(10至20KHE)的bH1,bH2块上进行两次MDCT操作。

通过使每一频率范围具有同样数目的频谱系数,同时频率分辩率是非常关键的,在低和中频率范围提供较大的频率分辩率,在高频率范围提供较大的时间分辩率(因为暂态信号包括更多的高频率成份)刚才所描述的方案使设备的结构得以简化。此外,当用因子2或4进一步划分块长使输入信号经受显著的暂态变化时,在所有频率范围内的时间分辩率可能自适应地被增大。

再参看图1,最好是由MDCT电路13至15进行MDCT处理所产生的频率域中的频谱系数,在被馈入到自适应位分配和量化电路16至18中之前,被分组到临界频带内。较高频率频谱系数被交替地分为按频率划较高频率临界频带所得到的子频带。为了使后面的描述简单起见,这里所用到的名词“临界频带”也包括这种子频带。

在自适应位分配和量化电路16至18中,在每一临界频带中的所有频谱系数用同样数目的量化位进行量化。自适应位分配和量化电路16至18分配用于在每一临界频带内量化频谱系数的量化位的数 目。自适应位分配和量化电路16、17和18将在下面进行描述。

量化后的频谱系数从自适应位分配和量化电路16至18馈入到输出端22、24和26。表示频谱系数在每一临界频带中正规化的块浮动系数和表示被用来在每一临界频带中量化频谱系数的量化位的数目的字长数据与量化后的频谱系数一起被馈入到输出端。

自适应位分配和量化电路结构的一个实例下面将参看图3进行描述。这一电路可采用数字逻辑芯片来构成,也可以利用一个适当编程的微处理器和辅助存贮器来实现。该电路也可以利用一个适当编程数子信号处理器芯片来实现。该电路可以用来实现图1所示电路的同样的数字信号处理芯片来实现。

图1所示的MDCT电路13、14和15的输出位图3所示的自适应位分配和量化电路300的输入端400被馈入频带幅值计算电路303,频带幅值计算电路303为每一频带-最好定为每一临界频带-计算频带幅值,该频带幅值最好是通过对每一频带中信号幅值的平方和开平方计算该频带上的能量来计算。每一频带的频带值可以由信号幅值的峰值或平均值交替在计算,也可通过对信号幅值作积分来计算。

对每一临界频带来自频带值计算电路303的输出的频谱代表一种称之为Bark频谱的频谱,例如,如图4所示。在该图中,为了简化绘图只示出了B1至B12十二个临界频带。

图3所示的电路对每一频带按照一种固定位分配模式分配固定模式量化位以及按照相关于频带频率加权的频带值分配的信号相关的量化位。

例如,假如可用于量化所有的频谱系数,并且可用于传送或记录 的位的数量是100Kilobits/秒(kb/s),本实施例根据从若干个固定位分配模式每个模式与用与100kg/s的位比率相干的若干位中所选出的一个模式来分配固定模式的量化位。根据固定位分配模式分配来量化位。根据固定位分配模式分配来量化频谱系数的实际的位的数量是根据下面将要详细描述的乘法器402的分布率来调整的。可得到的全部位的数量,例如与一个位比率100kb/s相关的位,由可得到的全部位数指示电路302来指示。可得到全部的位数也可以是外部可编程的。

在图3所示的方案中,提供了多种固定位分配模式,并且根据输入信号从中选择一种合适的模式。

固定位分配电路305中存贮了许多固定位分配模式,每一模式定义了对每一输入信号块在相应于100kb/s的若干位的频带间的一种分配。不同的固定位分配模式在中频率至低频率带和高频率带之间具有不同的位分配。最适当的一种固定位分配模式是响应输入信号所选择的,即对较低的输入信号电平通择一种模式,其中对较高频率的频带分配很少的位。这种选择利用了响应效应,即人类对较高频率范围的听觉灵敏度在较低的信号电平下会降低。虽然合适的固定位分配模式可以根据输入信号的电平来选择,或者根据所有频带的信号电频来选择,也可以根据一个频率划分电路-该电路利用一个滤波器将输入信号划分为频率成份-的输出来选择,也可以根据由一个或多个MDCT电路14至16(图1)所提供的一个或多个频谱系数来选择。

与信号相关的位分配是由与信号相关的位分配电路304根据频带值计算电路303的加权输出来实现的。乘法器410接受一个权模和频带值计算电路303的输出,并且将每个频带的值乘以由权模所定义的频带的加权系数,产生每个频带的一个加权频带值。每个频带的加权频带值被馈入与信号相关的位分配电路304。最佳实施例采用图5A所示的加权模式。

对输入信号的每块来说,与信号相关的位分配电路304向每一频带中的频谱系数分配与信号相关的量化位,使得位分配与每一频带的加权频带值相关。在所示的实施例中,与信号相关的位分配电路分配一定量的与信号相关的量化位,其数量等于根据所选择的固定位分配模式所分配的固定模式量化位的数量。最后分配来量化频谱系数的与信号相关的位的实际数量根据分布率由乘法器401进行调整,对此下面将作详细描述。

与信号相关的位分配电路304根据下式在频带间分配量化位:

b(k)=δ+1/2log2[6′2(k)/p]

其中b(k)是分配来量化第k个频带个的每一个频谱系数的与信号相关的量化位的数量,δ是一个最佳偏差,6′2(k)是第K个频带的加权频带值,P是对整个频谱所取的平均量化噪声能量。为了找到每一频带的最佳b(k)值,变化δ的值,使得对所有频带的b(k)的和等于或略小于可得到的与信号相关的量化位的数目。

作为将来自频带值计算电路303的频带值被加权系数的单一模式数乘的替代,频带值可以被多个加权模式中的一个合适的加权系数相乘。多种加权系数模式可以存贮在加权模式存贮器406中,根据输入信号可以选择一个合适的加权模式。

输入信号经由输入端404加到加权模式选择器408,加权模式选择器408选择一个合适的加权模式406,并将所选择的加权模式馈入乘法器410。该乘法器还接收频带值计算电路303的输出,并将每个频带的频带值乘以由所选择的加权模式定义的频带的加权系数,从而为每一频带提供一个加权频带值,该加权频带值被馈入到此信号相关的位分配电路304。

在图5A至5D中示出了一些典型的加权模式。此外,所示出的基本模式的变型也可以存贮起来。在这些变型中,基本模式在斜度上发生变化并将频率翻转,从而为一种宽范围输入信号情况提供最佳的加权。

加权模式选择器408根据输入信号的电平从加权模式存贮器406中选择一个合适的加权模式。该加权模式选择器在选择一个合适的加权模式时,可以额外地或交替地考虑输入信号的频谱量。

作为一种更一步的替代情况,加权模式选择器408可以通过在例如与输入信号相关的两个加权模式间作插值来计算一个加权模式,也可以根据输入信号调整所选择的加权模式的加权系数。在刚才所描述的方式中,本实施例改变加权系数来提供一种位分配,它能更适应人类的听觉,从而改进了声音的质量。

全部可得到的位数在根据一种固定位分配模式进行位分配和根据一种与信号相关的位分配模式进行位分配之间的划分是根据指示输入信号频谱的平滑性的一个指数来确定的。频带值计算电路303的输出被馈入到频谱平滑度计算电路308。该频谱平滑度计算电路经输入端400接收频谱系数,然后计算相邻频谱水平之差的绝对值之和除以所有频谱水平之和的商,即:

>>YI>=>0.5>×>>>>Σ>>i>=>1>>n>>|>Si>->Si>->1>|>>>>Σ>>i>=>1>>n>>|>Si>|> > >

其中I是频谱平滑度指数,Si是第i个频带中的频谱水平。最好是将频谱系数用作频谱水平。所计算的频谱平滑度指数1提供给划分比率确定电路309。该划分比率确定电路确定施加给全部可得到的位数的划分比率D。该划分比率D是根据一个固定位分配模式分配的位数与全部位数之比。划分比率确定电路还计算划分比率的补数(1-D),这个数是根据一个与信号相关的位分配模式分配的位数与全部位数之比。

划分比率确定电路309将划分比率D馈送到乘法器402,该乘法器通接收固定位分配电路305的输出。乘法器402考虑划分比率D计算根据一种固定位分配模式要分配给每一频带的实际的位数。划分比率确定电路309还将划分比率的补数1-D馈入到乘法器401,该乘法器还被提供与信号相关的位分配电路304的输出。乘法器401考虑划分比率D计算根据与信号相关的位分配模式所要分配给每一频带的实际的位数。

在一种替代方案中,可以不用乘法器401和402,划分比率D可以馈入到固定位分配电路305,该电路采用由全部可得到的位(例如等于100kb/s的位)数乘以划分比率得到的乘积所指示的位数来选择一个固定位分配模式,划分比率的补数1-D被馈入到与信号相关的位分配电路304,该电路分配将全部可得到的位(即等于100kg/s的位)数乘以与每一频带的加权频带值相关的频带间划分比率的补数所计算的位数。

乘法器401和402的输出被馈入加法器306。加法器306通过对输入信号的每一块,对每一频带,将固定位分配的值和与信号相关的位分配值相加来确定用于量化每一频带中的每一频谱系数所分配的全部量化数位。指示量化位总和的加法器306的输出被加到输出端307。然后由输出端307中所得到的数据所指示的量化位的数量对每一频带的频谱系数进行量化。对输入信号的每一块而言,在输出端307提供一组数,它指示分配来量化每一频带的频谱系数的位数。

在根据一种固定位分配模式所分配的位和根据一种与信号相关的位分配模式所分配的位之间对全部所得到的位数的划分所以如下交替地确定:对每一频带,用分贝所表示的加权信号能量的值被频谱平滑指数R(它可能是0到1间的一个值)相乘,所产生的积被相加以得到一个第一和值S1,每一频带的固定位分配模式被(1-R)相乘,所产生的积被相加以得到一个第二和值S2。第一和值和第二和值,S1和S2被除以第一和值与第二和值的和(S1+S2),产生第一和第二比率,该第一和第二和值分别用作与信号相关的位分配模式和固定位分配模式与全部可得到的位数之间的位划分比率。

图7示出如何将位分配到具有图6所示频谱的一个输入信号中的例子。为了减化绘图,只示出了十二频带。在图7个,标阴影的短形指示分配给每个频带的与信号相关的位数,没标阴影的矩形表示根据固定位分配模式分配给每一频带的位数。等于两种位数之和的一个个位数被分配来量化每个频带中的频谱系数。虽然图7所示的位数具有实数值而不是整数,该实数值最后要通过例如舍位来转化为相应的整数,从而得到分配来对每一频带的频谱进行量化的位数。

参看图6,输入信号包括具有彼此水平基本相等的窄频谱成份A、B和C。在一个传统的数据压缩器中,根据每一频带中信号成份的水平来分配以信号相关的位,从而获得最佳的信一噪比。对根据固定位分配模式分配给每个频带2、6和10的量化位在每一频带上大体上要加上同等量的与信号相关的位。根据本发明的数据压缩器当频率增大时对具有确定水平的频带分配较少量的量化位,从而分配给频带10的量化位较之分配给频带6的量化位少,分配给频带6的量化位较之分配给频带2的量化位少。

与传统的数据压缩器相比较,本发明的数据压缩器具有在较低频率下得到了改进,而在较高频率下退化的一个信-噪比特性。由于人类听觉灵敏度的频率特征,较高频率的噪声(在本发明的数据压缩器中被增大了)比较低频率的噪声更不易被听到。此外,较高频率的噪声被较低频率的信号所遮蔽。因此,在根据本发明的数据压缩器中噪声在较高频率的增大不为人类的听觉所感受。另一方面,人类听觉对其更为灵敏的较低频率的噪声在本发明的数据压缩器中被减少。总体效果就是由听众所感觉的声音质量得到了改进。

应该注意到,对例如图6和图7中的中间频率频带号6分配的位数要少于对低频率频带号2所分配的位数。这样一种位分配不能简单地靠在固定分配模式中永久性地给较低频率频带分配位数来实现。这种效果只有对输入信号的每一块而言,根据每一频带中被相关于频带频率加权的频带值,通过与信号相关的位分配来实现。

在所示的实施例中,假设在大约100HE以下MDCT产生相当少的频谱系数。然而,由于与较高频率相关的信号有效地呈现在每个较低频率频谱系数中,因此需要分配大量的位数来量化较低频率。作为一种近似,如果位分配依赖于相应频带的信号成份的水平,从而给较低频率分配更多位,这样就可以满足需要了。

一个数据压缩设备,其中对输入信号的一个相对长块进行正交变换来提供频谱系数,该设备在低于100HE的频率范围内提供足够的频该系数密度,从而对低于50HE的频带的频谱系数所作的与信号相关的位分配相比于对高于这一频率中的频带的位分配而言可以缩减。这种位缩减之所以能进行,是因为一类听觉在很低的频率范围灵敏度会降低。

图8示出了一辅助扩展器的方框图,该扩展器对由上面所描述的数据压缩设备所压缩的信号进行扩展。

参见图8,对每一频带量化的频谱系数被提供给扩展器的输入端122,124和126。块浮动信息、块大少信息以及指示各频带中用于量化频谱系数的位数的数据被提供到输入端123、125和127。提供给输入端的信号被馈送到反量化电路116、117和118,自适应位分配在其中被采用上面所提到的与量化位的数量相关的数据来进行逆变换,该自适应位分配而原始输入信号的每一块而言指示在每一频带中采用了多位来量化频谱系数。

反量化电路116、117和118的输出被加到改进的离散余弦反变换(IMDCT)电路113、114和115上,该电路还经输入端123、125和127提供给块大小信息。在IMDCT电路中,频率域中被反量化的频谱系数被正交变换为时间域中三个频率范围信号的一组采样值。来自IMDCT电路113、114和115的时间域中的频率范围信号采用反正交镜象滤波(IQMF)电路112和111组合成呈频段PCM数字音频信号,被馈送到输出端110。

应该注意到,由于图8所示的扩展器电路由压缩电路提供了指示量化位的数量的数据,该扩展器可以扩展由一个已知的数据压缩器所压缩的信号,并且当扩展被本发明的一个数据压缩器所压缩的一个信号时,将给出改进了的声音质量。示于图8的扩展器可以采用相对而言较少量的电路来扩展由数据压缩设备所提供的压缩数据,并产生一个高质量译码信号。

由上面的描述可知,本发明提供了一个数据压缩设备,其中可以得到的用于位分配的全部位划分为根据一个固定位分配模式所分配的位和根据一个与信号相关的位分配所分配的位。与信号相关的位分配是根据被依据频带频率进行加权处理的频带值来进行的。当该被压缩的信被扩展、译码、重现并被人的听觉感受时,这可提供最佳的位分配,对具有平频谱特性的信号、对具有一个单一频谱线的信号以及对具有大量窄频谱线的信号而言,不需要进行掩蔽所需的复杂计算。结果是,尽管具有小尺寸和低位比率,数据压缩设备都可获得高声音质量。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号