首页> 中国专利> 在快速恢复译码期间使用经量化的预测记忆

在快速恢复译码期间使用经量化的预测记忆

摘要

本发明揭示一种用于在快速恢复译码期间量化预测记忆的方法。对描述用于当前帧的预测记忆的最佳形状向量进行量化。确定是否发送所述经量化的最佳形状向量。基于所述确定而发送所述经量化的最佳形状向量。发送经编码的当前帧。

著录项

  • 公开/公告号CN103081005A

    专利类型发明专利

  • 公开/公告日2013-05-01

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN201180039749.1

  • 发明设计人 方正;丹尼尔·J·辛德尔;

    申请日2011-08-05

  • 分类号G10L19/005;G10L19/12;

  • 代理机构北京律盟知识产权代理有限责任公司;

  • 代理人宋献涛

  • 地址 美国加利福尼亚州

  • 入库时间 2024-02-19 19:15:47

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-24

    未缴年费专利权终止 IPC(主分类):G10L19/005 授权公告日:20150819 终止日期:20190805 申请日:20110805

    专利权的终止

  • 2015-08-19

    授权

    授权

  • 2013-06-05

    实质审查的生效 IPC(主分类):G10L19/005 申请日:20110805

    实质审查的生效

  • 2013-05-01

    公开

    公开

说明书

相关申请案

本申请案与以下申请案相关且主张以下申请案的优先权:2010年8月10日申请的第61/372,398号美国临时专利申请案“用于预测性语音编解码器的误差弹性的系统、方法和设备(Systems,Methods,and Apparatus for Error Resilience for Predictive SpeechCodecs)”以及2010年8月24日申请的第61/376,602号美国临时专利申请案“在快速恢复译码期间使用量化预测记忆(Using Quantized Prediction Memory During Fast RecoveryCoding)”。

技术领域

本发明大体来说涉及用于通信系统的电子装置。更具体来说,本发明涉及在快速恢复译码期间使用量化预测记忆。

背景技术

电子装置(蜂窝式电话、无线调制解调器、计算机、数字音乐播放器、全球定位系统单元、个人数字助理、游戏装置等)已变成日常生活的一部分。小型计算装置现今被放置于从汽车到房屋锁的一切事物中。近几年来,电子装置的复杂性已大大增加。举例来说,许多电子装置具有帮助控制装置的一个或一个以上处理器以及用以支持处理器及装置的其它零件的若干数字电路。

广泛部署无线通信系统以提供各种类型的通信内容,例如话音、视频、数据等。这些系统可为能够支持多个无线通信装置与一个或一个以上基站的同时通信的多址系统。

在一些配置中,语音的成功解码可取决于先前语音。在先前接收的语音恶化时,此可产生问题。因此,可通过用于在快速恢复译码期间使用量化预测记忆的系统及方法实现益处。

发明内容

揭示一种用于在快速恢复译码期间量化预测记忆的方法。对描述用于当前帧的预测记忆的最佳形状向量进行量化。确定是否发送所述经量化的最佳形状向量。基于所述确定而发送所述经量化的最佳形状向量。发送经编码的当前帧。

可确定所述最佳形状向量是否比用于一个或一个以上先前帧的先前预测记忆更准确的指示。可基于所述最佳形状向量是否比用于一个或一个以上先前帧的先前预测记忆更准确的所述确定而发送所述指示。可基于是否发送所述经量化的最佳形状向量的所述确定而发送用于所述当前帧的所述预测记忆的经量化的位置及经量化的能量。

可针对每个帧发送所述经量化的最佳形状向量、经量化的位置、经量化的能量及所述指示。或者,可基于源控制参数或信道控制参数或两者发送所述经量化的最佳形状向量、经量化的位置、经量化的能量及所述指示。所述源控制参数可包括经编码的当前帧中的自适应性码簿贡献与所述经编码的当前帧中的固定码簿贡献的比率。所述信道控制参数可包括发射信道中的可用带宽或无线通信系统中的包丢失率。

可确定所述最佳形状向量是否比用于一个或一个以上先前帧的先前预测记忆更准确的所述指示。此确定可包括使用对所述经编码的当前帧的固定码簿贡献及基于所述形状向量的快速恢复自适应性码簿贡献来重构最佳残余信号。此确定还可包括选择先前预测记忆,且基于每一先前预测记忆确定先前预测记忆残余信号。此确定还可包括基于所述先前预测记忆残余信号与所述最佳残余信号的比较来修改先前预测记忆比较位中的用于每一选定先前预测记忆的位。此确定还可包括将所述最佳形状向量的索引及所述先前预测记忆比较位包括于经编码的形状位中。所述最佳残余信号可为具有最大加权信噪比(SNR)的残余信号。所述预测记忆的所述位置可为先前帧的一部分中的具有最大振幅的相对位置。

还揭示一种用于在快速恢复译码期间量化预测记忆的发射终端。所述发射终端包括处理器及与所述处理器电子通信的存储器。可执行指令存储于所述存储器中。所述指令可执行以对描述用于当前帧的预测记忆的最佳形状向量进行量化。所述指令还可执行以确定是否发送所述经量化的最佳形状向量。所述指令还可执行以基于所述确定而发送所述经量化的最佳形状向量。所述指令还可执行以发送经编码的当前帧。

一种用于在快速恢复译码期间量化预测记忆的发射终端。所述发射终端包括用于对描述用于当前帧的预测记忆的最佳形状向量进行量化的装置。所述发射终端还包括用于确定是否发送所述经量化的最佳形状向量的装置。所述发射终端还包括用于基于所述确定而发送所述经量化的最佳形状向量的装置。所述发射终端还包括用于发送经编码的当前帧的装置。

还揭示一种用于在快速恢复译码期间量化预测记忆的计算机程序产品。所述计算机程序产品包含在上面具有指令的计算机可读媒体。所述指令包括用于对描述用于当前帧的预测记忆的最佳形状向量进行量化的代码。所述指令还包括用于确定是否发送所述经量化的最佳形状向量的代码。所述指令还包括用于基于所述确定而发送所述经量化的最佳形状向量的代码。所述指令还包括用于发送经编码的当前帧的代码。

还揭示一种用于在快速恢复译码期间使用量化预测记忆的方法。接收经编码的当前帧及包括位置、形状及能量的经编码的预测记忆。在先前帧为擦除项的情况下,解码所述所接收的经编码的预测记忆。在所述先前帧为擦除项的情况下,使用最佳预测记忆来解码所述经编码的当前帧。

可从所述经解码的所接收的预测记忆及用于一个或一个以上先前接收的帧的先前预测记忆中确定所述最佳预测记忆。在所述先前帧不为擦除项的情况下,可使用所存储的先前预测记忆来解码所述经编码的当前帧。所述预测记忆的所述位置可为先前帧的一部分中的具有最大振幅的相对位置。所述形状可描述先前帧的一部分。所述能量可描述先前帧的能量。

还揭示一种用于在快速恢复译码期间量化预测记忆的接收终端。所述接收终端包括处理器及与所述处理器电子通信的存储器。可执行指令存储于所述存储器中。所述指令可执行以接收经编码的当前帧及包含位置、形状及能量的经编码的预测记忆。所述指令还可执行以在先前帧为擦除项的情况下解码所述所接收的经编码的预测记忆。所述指令还可执行以在所述先前帧为擦除项的情况下使用最佳预测记忆来解码所述经编码的当前帧。

还揭示一种用于在快速恢复译码期间使用量化预测记忆的接收终端。所述接收终端包括用于接收经编码的当前帧及包含位置、形状及能量的经编码的预测记忆的装置。所述接收终端还包括用于在先前帧为擦除项的情况下解码所述所接收的经编码的预测记忆的装置。所述接收终端还包括用于在所述先前帧为擦除项的情况下使用最佳预测记忆来解码所述经编码的当前帧的装置。

一种用于在快速恢复译码期间使用量化预测记忆的计算机程序产品。所述计算机程序产品包含在上面具有指令的计算机可读媒体。所述指令包括用于使接收终端接收经编码的当前帧及包含位置、形状及能量的经编码的预测记忆的代码。所述指令还包括用于使接收终端在先前帧为擦除项的情况下解码所述所接收的经编码的预测记忆的代码。所述指令还包括用于使接收终端在所述先前帧为擦除项的情况下使用最佳预测记忆来解码所述经编码的当前帧的代码。

附图说明

图1为说明在快速恢复译码期间使用量化预测记忆的系统的框图;

图2为说明使用码激励线性预测(CELP)的编码及解码的一组波形;

图3为说明用于在快速恢复译码期间量化预测记忆的方法的流程图;

图4为说明用于在快速恢复译码期间使用量化预测记忆的方法的流程图;

图5为说明使用快速恢复位的解码的一组波形;

图6为说明预测记忆模块的框图;

图7为说明用于搜索最佳预测记忆的方法的流程图;

图8为说明在发射终端处搜索最佳形状向量的一组波形;

图9为说明可在快速恢复位中量化的形状向量候选者的一组波形;

图10为说明(例如)在接收终端处的预测记忆模块的另一框图;

图11说明可包括于发射终端内的特定组件;及

图12说明可包括于接收终端内的特定组件。

具体实施方式

话音通信可遭受由包丢失及帧擦除引起的质量降级。一些语音编解码器(例如增强型可变速率编解码器(EVRC)或自适应性多重速率(AMR)音频编解码器)为预测性编解码器。在这些编解码器中,利用邻近帧之间的相依性来减小位率。然而,当存在帧擦除时,此相依性可引起降级的性能。换句话说,一个帧的不正确解码或恶化可能影响稍后帧的质量,因为稍后帧的解码可能依赖于所述帧。

本发明的系统及方法可在一个或一个以上帧擦除发生时使用误差弹性技术来使得语音解码能够较快速地恢复。此快速恢复译码在质量(通过使用闭合环路量化方案)及位率(通过使用源控制及信道控制方案)两者上可为最优的。换句话说,本发明的系统及方法可减轻话音通信中由包丢失或帧擦除引起的质量降级。更具体来说,快速恢复译码可量化预测记忆,且使其与经规则地译码的位一起发送。在先前帧为擦除项时,此预测记忆可用以解码当前帧。另外,所提出的误差弹性技术可为源控制的、信道控制的或两者。

图1为说明在快速恢复译码期间使用量化预测记忆的系统100的框图。系统100可包括将数据发送到接收终端104的发射终端102。发射终端102及接收终端104可为能够支持话音通信的任何装置,包括电话、计算机、音频广播及接收设备、视频会议设备或其类似者。

在一个配置中,发射终端102或接收终端104可为无线通信装置或基站。系统100可用无线多址技术(例如码分多址(CDMA)能力)实施。CDMA为基于展频通信的调制及多址方案。如本文中所使用,术语“无线通信装置”指代可用于无线话音通信、数据通信或两者的电子装置。无线通信装置的实例包括蜂窝式电话、个人数字助理(PDA)、手持式装置、无线调制解调器、膝上型计算机、个人计算机等。无线通信装置可替代地称作接入终端、移动终端、移动台、远程台、用户终端、终端、订户单元、订户台、移动装置、无线装置、用户设备(UE)或某一其它类似术语。术语“基站”指代安装于固定位置处且用以与无线通信装置通信的无线通信站。基站可替代地称作接入点、节点B、演进型节点B或某一其它类似术语。

发射终端102及接收终端104可各自包括声码器106a到106b。声码器106a到106b可在发射终端102处编码或压缩用于无线发射的音频,或在接收终端104处解码或解压缩音频。在发射终端102的至少一个配置中,语音可以帧形式输入到声码器106a到106b,其中每一帧进一步分割成子帧(例如,20ms)。可使用这些任意帧边界,此处执行某种块处理。然而,如果实施连续处理而非块处理,则可不将语音样本分割成帧(及子帧)。

声码器106a到106b可包括线性预测性译码(LPC)模块108a到108b。发射终端102处的LPC模块108a可通过估计共振峰且从语音移除共振峰的效应来分析语音。其后,可译码残余信号。接收终端104处的LPC模块108b可通过使所述过程反转来合成语音。明确地说,接收终端104处的LPC模块108b可使用残余语音来产生语音源,使用所述共振峰来产生滤波器(其表示声道),且使语音源穿过所述滤波器以合成语音。

在发射终端102处的LPC分析之后,可译码残余信号。在一个配置中,基于特定音频帧的特性来选择译码模式110a到110b(例如,原型音高周期(PPP)模式、码激励线性预测(CELP)模式或噪声激励线性预测(NELP)模式)以编码及解码音频帧。举例来说,EVRC-B可使用PPP、CELP及NELP。另一方面,EVRC-WB可仅使用CELP及NELP。另外,AMR及AMR-WB(两个全球移动电信系统(UMTS)编解码器)可仅使用CELP。因此,译码的类型可取决于所使用的特定系统。虽然本发明的系统及方法使用CELP来描述,但本文中描述的快速恢复译码可与依赖于先前帧来解码当前帧的任何预测性译码方案一起使用。

CELP模块112a到112b可用以编码具有不良周期性的语音或涉及从一个周期性区段到另一周期性区段改变的语音。因此,CELP可用以译码分类为瞬时语音的帧。由于可能难以从仅一个原型音高周期准确地重构这些帧,所以CELP模块112a到112b可编码整个语音帧的特性。此情形可产生准确语音再现,但使用较高位率。CELP译码可使用自适应性码簿114a到114b贡献及固定码簿116a到116b贡献。在一些编解码器中,CELP可用以编码具有不同特性的所有语音帧,例如有声语音帧、无声语音帧及瞬时语音帧,例如,AMR、EVRC、AMR-WB。

声码器106a到106b还可包括其它模块118a到118b。举例来说,原型音高周期(PPP)模块(未图示)可用以译码分类为有声语音的帧,有声语音包括随时间而缓慢变化的周期性分量。通过利用有声语音的周期性,PPP可实现比CELP低的位率,且仍以在感知上准确的方式再现语音信号。此外,NELP模块(未图示)可译码分类为无声语音的帧。更具体来说,NELP模块可用以编码在特性上类似噪声的语音,例如无声语音或背景噪声。NELP可使用最简单模型用于经译码的语音,且因此可实现较低位率。

一旦产生,经编码的音频帧120a到120b便可发射到接收终端104。然而,经编码的音频帧120a到120b中的一些可能未被正确地接收,即,可能在接收终端104处断言帧擦除。在一个配置中,声码器106a到106b可接收当前帧是否从调制解调器或话音应用擦除的指示。一些译码技术依赖于先前帧来解码当前帧。举例来说,CELP解码可使用从先前帧确定的预测记忆来确定当前帧中的自适应性码簿114a到114b贡献。因此,单一帧擦除还可能消极地影响后续帧。

本发明的系统及方法可在一个或一个以上帧擦除之后使用误差弹性技术(在本文中被称作“快速恢复”)来实现经解码的语音的快速恢复。换句话说,术语“快速恢复译码”指代允许在解码器处从帧擦除快速恢复的译码方法。预测记忆模块122a到122b可用以量化及解量化预测记忆。预测记忆可为来自用以解码当前帧的先前帧的数据,即,用于帧N的预测记忆可为描述帧N-1的一些或全部的数据。在CELP中,预测记忆可称作音高记忆。

在快速恢复译码期间,预测记忆可通过预测记忆编码器124a到124b量化成快速恢复位128a,且与其它规则的经编码位(即,与经编码的音频帧120a到120b)一起发送。如果不存在擦除,则可在接收终端104处不使用快速恢复位128b。然而,如果擦除发生,则在擦除之后的第一良好帧中,预测记忆可从快速恢复位128a到128b解量化(使用预测记忆解码器126a到126b),且用以替换归因于擦除而恶化的现存预测记忆。通过使用经量化的预测记忆,当前帧中的语音波形可以更准确方式重构。

快速恢复位128a到128b可包括基于闭合环路最优准则量化的位置位130a到130b、形状位132a到132b及能量位134a到134b。预测记忆的量化可为源控制的及信道控制的以实现质量与位率之间的最佳取舍。如本文中所使用,术语“源控制”描述基于发射终端102处的源音频的特性来限制动作(例如,量化预测记忆)。在一个配置中,预测记忆的量化可至少部分地取决于经编码的音频帧120a到120b中的自适应性码簿114a到114b贡献与固定码簿116a到116b贡献的比率,例如,如果所述比率高于预定阈值,则量化所述预测记忆。换句话说,如果此比率较高,则当前帧可高度地取决于先前帧,因此预测记忆可量化成快速恢复位128a到128b且被发射。相反,在所述比率较低时(即,在当前帧不高度地取决于先前帧时),可不发送快速恢复位128a到128b。或者,快速恢复位128a到128b可针对每个帧来发送,但仅在其提供比在无快速恢复位128a到128b的情况下更好的重构时使用。如本文中所使用,术语“信道控制”描述基于发射特性限制动作。举例来说,如果在发射信道中存在可用带宽或如果包丢失率较高,则预测记忆可较可能被量化且发射。

图2为说明使用码激励线性预测(CELP)的编码及解码的一组波形。具体来说,图2的上半部说明根据索引的在LPC分析之后的残余语音帧248,即,帧(N-2)236a,其后为帧(N-1)238a,其后为当前帧N240a。尽管使用CELP说明,但本发明的系统及方法可用于在使用任何预测性译码方法的系统中的从擦除的快速恢复。在CELP中,编码器可接收一系列帧236a、238a、240a。当前帧N240a的解码可依赖于从帧(N-1)238a确定的预测记忆(在CELP中被称作音高记忆246a到246b)。换句话说,用于帧N的音高记忆246可从帧(N-1)238a确定。举例来说,用于帧N的音高记忆246a可从帧N-1238a中的最后一个音高循环的残余信号构造。用于帧N的音高记忆246a(从帧(N-1)238a确定)可用以确定自适应性码簿贡献242a。自适应性码簿贡献242a与残余语音信号248之间的差异可量化成固定码簿贡献244a,即,固定码簿贡献244a可表示自适应性码簿贡献242a中的量化误差。因此,经编码的音频帧可包括自适应性码簿贡献242a及固定码簿贡献244a。

图2的下半部表示经解码的残余语音信号250。换句话说,经解码的残余语音信号250可表示所接收的在接收终端104处解码的经编码的音频帧。经解码的残余语音信号250可包括经解码的帧(N-2)236b,其后为经解码的帧(N-1)238b,其后为经解码的当前帧N240b。经解码的帧(N-1)238b可能尚未被正确地解码,且可在接收终端104处断言帧擦除。然而,在一个配置中,在确定当前帧N240b的自适应性码簿贡献242b时,解码器可仍从经解码的帧(N-1)238b确定预测记忆246b。由于经解码的帧(N-1)238b已恶化,所以经解码的帧(N-1)238b中的误差可传播到经解码的自适应性码簿贡献242b中。因此,甚至在添加固定码簿贡献244b之后,最后经解码的当前帧N240b可能仍不为原始当前帧N240a的准确表示。

替代在接收终端104处确定用于帧N的音高记忆246b,在快速恢复译码中,发射终端102可将用于帧N的音高记忆246a量化成快速恢复位,且将所述快速恢复位发射到接收终端104。接收终端104可将快速恢复位解码成预测记忆(即,CELP中的音高记忆),且替代用于帧N的音高记忆246b而使用所接收的音高记忆来解码当前帧N240b。此可减少在帧擦除之后误差的传播。

图3为说明用于在快速恢复译码期间量化预测记忆的方法300的流程图。可由发射终端102执行方法300。发射终端102可使用预测性译码方案(即,依赖于先前帧来解码当前帧的译码方案,例如CELP)编码302当前帧。发射终端102还可确定304经编码的当前帧中的自适应性码簿贡献242a与经编码的帧中的固定码簿贡献244a的比率。此比率可指示当前帧是否高度取决于先前帧(即,源控制参数)。发射终端102还可确定306无线通信系统中的带宽可用性或信道条件(或两者)(即,信道控制参数)。发射终端102还可基于源控制参数或信道控制参数或两者确定308是否发送预测记忆与经编码的当前帧。预测记忆可为从先前帧(即,帧N-1)确定的音高记忆。预测记忆的发射可为源控制的(即,使用源控制参数确定)。举例来说,自适应性码簿贡献242a与固定码簿贡献244a的高比率可指示高度取决于先前帧的帧,且因此应量化且发射预测记忆。相反,低比率可指示当前帧不高度取决于先前帧,且因此应不量化且发射预测记忆。类似地,快速恢复还可基于带宽可用性或信道条件(即,基于信道控制参数)加以调适。举例来说,快速恢复技术可自适应性地启用及停用以实现任何指定的平均位率。

在一个配置中,预测记忆可针对每个帧而经量化且发送到接收终端,且接收终端104可选择性地使用经量化的预测记忆。在此配置中,接收终端104可仅在快速恢复位128b提供如由发射终端102指示的最准确的经重构的当前帧的情况下(即,在快速恢复位128b产生最佳预测记忆的情况下)使用快速恢复位128b。

因此,编码器可始终发送快速恢复位128a到128b或仅基于源控制或信道控制参数来发送快速恢复位128a到128b。然而,与发送快速恢复位128a到128b的条件无关,接收终端可仅在快速恢复位128a到128b为用于恢复的最佳选项时(即,如果快速恢复位128b产生最准确的预测记忆)使用快速恢复位128a到128b。

如果发射终端102确定308不发送预测记忆,则发射终端102可发送310经编码的当前帧而不发送预测记忆。然而,如果发射终端102确定308发送预测记忆,则发射终端102可编码312预测记忆的位置、形状及能量,即,编码成快速恢复位128a到128b。形状位132a到132b可描述音高记忆的形状。能量位134a到134b可描述音高记忆的能量或体积。未经量化的形状可等于音高记忆或比音高记忆短。因此,位置位130a到130b可描述一些位置信息,使得解码器可使用所述位置信息来确定在何处安置所述形状以产生准确的未经量化的音高记忆。在一个配置中,位置位130a到130b可指示音高记忆内的具最大振幅的相对位置。换句话说,编码可包括量化预测记忆以产生快速恢复位。发射终端102还可发送314预测记忆的经编码的位置130a到130b、形状132a到132b及能量134a到134b与经编码的当前帧。

图4为说明用于在快速恢复译码期间使用量化预测记忆的方法400的流程图。可由接收终端104执行方法400。接收终端104可接收402经编码的当前帧及包括位置位130a到130b、形状位132a到132b及能量位134a到134b的经编码的预测记忆(即,快速恢复位128b)。接收终端104可能已获知经编码的预测记忆,因为经编码的预测记忆可在与无经编码的预测记忆的帧不同类型的帧中接收。接收终端104可确定404先前帧是否为擦除项。如果不为擦除项,则接收终端104可使用所存储(即,从经解码的先前帧确定)的预测记忆解码412经编码的当前帧。换句话说,在先前帧不为擦除项时,接收终端104可忽略所接收的经编码的预测记忆。然而,如果先前帧为擦除项,则接收终端104可解码406所接收的经编码的预测记忆。接收终端104还可从经解码的预测记忆及用于一个或一个以上先前接收的帧的先前预测记忆中确定408最佳预测记忆。举例来说,如果帧N为当前帧,但从帧N-2(即,在擦除项之前)确定的预测记忆产生比快速恢复位128b更准确的帧N,则可替代所接收的快速恢复位128b而使用从帧N-2确定的预测记忆。在一个配置中,快速恢复位128b可包括先前预测记忆比较位以帮助接收终端104确定408最佳预测记忆(例如,快速恢复位128b是否产生比用于在擦除项之前的帧的预测记忆更准确的预测记忆)。

接收终端104还可使用最佳预测记忆来解码410经编码的当前帧。换句话说,当先前帧为擦除项时,接收终端可替代从经解码的先前帧确定预测记忆而使用所接收的预测记忆(即,快速恢复位128b)。

图5为说明使用快速恢复位的解码的一组波形。顶部波形可为接收终端104处的经解码的残余语音信号550。具体来说,可正确地接收且解码(例如,使用CELP)帧(N-2)536。然而,帧(N-1)538可能恶化,且可在接收终端104处断言擦除。可重构帧(N-1)538,然而,其可能不为高度准确的,即,其可能不匹配原始地编码的帧(N-1)(未图示)。因此,如果基于经重构的帧(N-1)538确定用于当前帧N540的音高记忆,则帧(N-1)538中的误差可能传播到当前帧N540。

替代地,接收终端104可确定基于快速恢复位的音高记忆552。换句话说,并非从先前帧(N-1)538确定音高记忆,接收终端104可使用所接收的快速恢复位128b来确定用于当前帧N540的音高记忆。可使用基于快速恢复位(即,与经编码的当前帧N一起发送的快速恢复位)的音高记忆552确定自适应性码簿贡献542。表示自适应性码簿量化中的误差的固定码簿贡献544可接着添加到自适应性码簿贡献542以形成经解码的当前帧N540。

图6为说明预测记忆模块622的框图。预测记忆模块622可包括预测记忆编码器624及预测记忆解码器626。预测记忆编码器624可确定可发射到接收终端104的快速恢复位628中的位置位630、形状位632及能量位634。在一个配置中,预测记忆的量化可通过再使用CELP编解码器中可用的合成式分析框架而为闭合环路。当前音频帧可首先以正常方式译码。接着,可量化预测记忆。

LPC模块608可从音频帧/激励信号656确定残余信号648。自适应性码簿(ACB)可用以从残余信号648的一部分确定自适应性码簿(ACB)贡献642,例如,残余信号648的对应于先前帧的一部分可用以确定对当前帧的自适应性码簿贡献642。自适应性码簿贡献642与残余语音信号648之间的差异可使用固定码簿616而量化成固定码簿贡献644,即,固定码簿贡献644可表示自适应性码簿贡献642中的量化误差。因此,经编码的音频帧可包括自适应性码簿贡献642及固定码簿贡献644。

在使用预测性译码时帮助解码器从帧擦除恢复的一种可能方式可为量化且发送来自编码器的预测记忆的位置630(例如,相位信息)及能量634。接着,在解码器处,可使用经发射的位置630及能量634产生且按比例缩放仿真波形。换句话说,此配置不在编码器处量化或发送预测记忆的实际形状632,而是在解码器处(例如,基于例如信号的信噪比等信号分类参数)产生仿真波形。然而,仿真波形可不为非常准确的,因为其并非基于预测记忆的实际形状632。相反,本发明的系统及方法可使用形状向量码簿664量化预测记忆的形状632。因此,本发明的系统及方法可在解码器处产生比使用基于信号分类参数的仿真波形的配置更准确的预测记忆。

快速恢复位628中的位置位630可使用最大振幅检测器654加以确定,所述最大振幅检测器654确定在残余信号648的一部分中的具最大振幅的相对位置。能量位634可使用能量检测器658基于残余信号648加以确定。举例来说,残余信号648的能量可使用标量量化器来量化。

形状向量搜索模块660可使用闭合环路搜索来最优地搜索最佳预测记忆。最佳预测记忆可从一组先前音高记忆信号662(在先前帧之前)及形状向量码簿664中确定。最佳形状向量670可指代在形状向量码簿664中的形状向量候选者678当中的最准确地描述预测记忆的形状向量。然而,最佳形状向量670可能并不产生最佳预测记忆,即,先前音高记忆信号662中的一者可能较好。最佳预测记忆可使用先前预测记忆比较位668来指示,所述先前预测记忆比较位668指示最佳形状向量670是否比用于一个或一个以上先前帧的先前预测记忆信号662更准确。

形状向量码簿664可为新码簿或可再使用用于其它目的的现存码簿。在本文中术语“码向量”与“形状向量”可互换地使用。形状向量可描述音高记忆的形状。举例来说,如果正被编码的当前帧为帧N,则形状向量可描述用于当前帧N的音高记忆,其为帧N-1的一部分。形状向量可从不紧接在前的一个或一个以上先前音高记忆信号662加以确定。举例来说,用于帧N的音高记忆可从帧N-2或帧N-3的一部分加以确定。

形状向量位632可包括两个部分。第一部分可为指示形状向量码簿664中的最佳形状向量670的索引665的位。第二部分可为指示先前音高记忆中的每一者是否提供比来自形状向量码簿664的最佳形状向量670更好的性能的位(即,先前预测记忆比较位668)。举例来说,如果正被编码的当前帧为帧N,则先前音高记忆(用于帧N-1的音高记忆,其为帧N-2的一部分;及用于帧N-2的音高记忆,其为帧N-3的一部分)可用作用于当前帧N的最佳预测记忆的候选者。用于每一先前音高记忆信号662的一个位可包括于先前预测记忆比较位668中以指示其是否比来自形状向量码簿664的最佳形状向量670更准确。先前音高记忆662可提供比来自形状向量码簿的最佳形状向量670更好的性能。然而,先前音高记忆662可能在接收终端104处不可用,这是由于在当前帧之前的行中可能存在多个擦除项。

为了搜索最佳形状向量670,形状向量搜索模块660可模拟在解码帧时解码器的动作(即,合成式分析)。首先,形状向量搜索模块660可从形状向量码簿664确定最佳形状向量670。为进行此操作,可针对每一形状向量候选者678(即,形状向量码簿664中的每个形状向量)确定不同快速恢复自适应性码簿贡献676。换句话说,快速恢复自适应性码簿贡献676可各自使用不同形状向量候选者678加以确定,如同其在快速恢复位628中接收那样。经重构的残余信号672可通过组合每一快速恢复自适应性码簿贡献676与固定码簿贡献644来形成。给定经解量化的固定码簿贡献644,具有最佳(最大)加权信噪比(SNR)的经重构的残余信号672可用以找到最佳形状向量670,即,与原始残余信号648最低程度地不同的经重构的残余信号672可识别最佳形状向量670。换句话说,与形成最准确的经重构的残余信号672的快速恢复自适应性码簿贡献676相关联的形状向量候选者678可为最佳形状向量670。在一个配置中,较简单的开放环路准则可用以搜索最佳形状向量670,(例如)以基于相关或均方误差来将每一形状向量候选者678与音高记忆进行比较。

上文描述的形状向量搜索程序可首先用以确定形状向量码簿664中的最佳形状向量670(即,最佳形状向量670)。快速恢复形状位128b的第一部分可描述最佳形状向量670在形状向量码簿664内的索引665,即,索引665可为经量化的形状向量670。接着,可应用相同搜索程序以确定先前音高记忆信号662中的每一者是否提供比最佳形状向量670更好的性能。换句话说,最佳形状向量670可能并不产生最佳预测记忆,例如,从帧N-2确定的预测记忆可能比最佳形状向量670更准确。因此,在快速恢复形状位632的第二部分(即,先前预测记忆比较位668)中,可针对先前音高记忆信号662中的每一者使用一个位以指示在先前帧丢失时针对当前帧的重构,其是否比最佳形状向量670更准确。举例来说,可使用两个位来描述在先前帧丢失时针对当前帧N的重构,用于帧N-1的先前音高记忆信号662及用于帧N-2的音高记忆信号是否提供比最佳形状向量670更好的预测记忆。

在一个配置中,经编码的帧可包括自适应性码簿贡献642、固定码簿贡献644及LPC参数(未图示)。这三者可在接收终端104处使用以在先前帧不为擦除项时解码当前帧。然而,另外,发射终端102可发送快速恢复位628以在先前帧为擦除项时帮助解码当前帧。经编码的帧数据可始终被发送。然而,快速恢复位628可基于源控制参数及/或信道控制参数有条件地发送。或者,快速恢复位628也可针对每个帧来发送。

图7为说明用于搜索最佳预测记忆的方法700的流程图。可由发射终端102执行方法700。最佳预测记忆可来自最佳形状向量670或先前音高记忆662。

发射终端102可基于激励信号656(或残余信号648)及自适应性码簿614确定702对经编码的音频帧的自适应性码簿贡献642。发射终端102还可通过将自适应性码簿贡献642与激励信号656(或残余信号648)进行比较来确定704固定码簿贡献644。发射终端102还可从形状向量码簿664选择706最佳形状向量670。此可包括选择产生具有最佳加权信噪比(SNR)的经重构的残余信号672的形状向量候选者678(从形状向量码簿664选择)。发射终端102还可基于固定码簿贡献644及基于最佳形状向量670的快速恢复自适应性码簿贡献676来重构708最佳残余信号,即,最佳残余信号可为使用最佳形状向量670的经重构的残余信号672。发射终端102还可选择710先前音高记忆信号662,且基于先前音高记忆信号662确定先前音高记忆残余信号,即,替代使用最佳形状向量670而使用经选定的先前音高记忆信号来重构残余信号。

发射终端102还可基于先前音高记忆残余信号与最佳残余信号(即,与最佳形状向量670相关联的经重构的残余信号672)的比较来修改712先前预测记忆比较位668中的用于所选定的先前音高记忆信号662的位。在一个配置中,此比较可包括确定先前音高记忆残余信号是否具有比最佳残余信号更好的(最大)加权信噪比(SNR)。用于先前音高记忆信号662中的每一者的一个位可在先前预测记忆比较位668中发射以指示对应先前音高记忆信号662是否比最佳形状向量670更好。更具体来说,对于比形状向量码簿664中的最佳形状向量670更好的先前音高记忆信号662,可将1插入于先前预测记忆比较位668中,且对于比最佳形状向量670差的先前音高记忆信号662,可将0插入于先前预测记忆比较位668中。发射终端102还可确定714是否存在更多先前音高记忆信号662待测试。如果是,则发射终端102可选择新的先前音高记忆信号662来测试。如果否,则发射终端102可将来自形状向量码簿664的最佳形状向量670的索引665及先前预测记忆比较位668包括716于快速恢复形状位628中。

图8为说明在发射终端102处搜索最佳形状向量670的一组波形。顶部波形表示激励信号656或残余信号848中的帧。用于当前帧N840的自适应性码簿(ACB)贡献842可基于在帧(N-2)836之后的先前帧(N-1)838确定。固定码簿贡献844可通过将自适应性码簿贡献842与激励信号656或残余信号848进行比较来确定,即,固定码簿贡献844可表示自适应性码簿贡献842中的误差。此可遵循传统CELP编码。

然而,可针对每一形状向量候选者878确定快速恢复自适应性码簿贡献876,即,针对每一形状向量候选者878(形状向量码簿664中的每一向量)再次确定快速恢复自适应性码簿贡献876。每一快速恢复自适应性码簿贡献876可与固定码簿贡献844组合以确定经重构的残余信号872(即,基于快速恢复)。最准确(即,最佳)经重构的残余信号872可用以识别最佳形状向量670。在一个配置中,最佳经重构的残余信号872可为具有最大加权SNR的经重构的残余信号872。最佳经重构的残余信号872中的用以产生快速恢复自适应性码簿贡献876的形状向量候选者878可为最佳形状向量670。

图9为说明可在快速恢复位中量化的形状向量候选者的一组波形。顶部波形说明可包括帧(N-2)936、帧(N-1)938及当前帧N940的残余语音信号948(或激励信号656)。当使用CELP解码当前帧N940时,可从帧(N-1)938确定用于帧N的音高记忆946。当选择最佳预测记忆时,编码器可使用来自帧N-1之前(例如,来自帧(N-2)936、帧(N-3)(未图示))或来自经预训练的码向量(即,形状向量候选者978)的先前音高记忆信号962。因此,可从最佳形状向量670(即,形状向量候选者978中的一者)或从先前音高记忆信号962确定最佳音高记忆。

图10为说明(例如)在接收终端104处的预测记忆模块1022的另一框图。预测记忆模块1022可包括与图6中说明的预测记忆模块622类似的功能性且使用与图6中说明的预测记忆模块622类似的数据。具体来说,预测记忆编码器1024、快速恢复位1028、位置位1030、形状位1032、形状索引1065、先前预测记忆比较位1068、能量位1034、形状向量码簿1064、自适应性码簿1014、固定码簿1016及LPC模块1008可对应于以下各者且具有与以下各者类似的功能性:图6中说明的预测记忆编码器624、快速恢复位628、位置位630、形状位632、形状索引665、先前预测记忆比较位668、能量位634、形状向量码簿664、自适应性码簿614、固定码簿616及LPC模块608。

预测记忆模块1022还可包括确定用于解码当前帧的最佳音高记忆1080的预测记忆解码器1026。预测记忆解码器1026可接收来自发射终端102的快速恢复位1028、先前音高记忆信号1062、固定码簿索引1084及LPC参数1086。如果未针对先前帧断言擦除,则接收终端104可不使用快速恢复位1028。而是,接收终端104可使用先前音高记忆信号1062(即,从先前接收的帧确定)解码当前帧。

如果先前帧为擦除项,则快速恢复位1028可用以确定最佳音高记忆1080,最佳音高记忆1080可接着用以解码当前帧(即,确定当前帧中的自适应性码簿贡献1042)。可使用形状向量码簿1064从索引位1065确定最佳形状向量1070。最佳形状向量1070、位置位1030及能量位1034可输入到快速恢复音高记忆模块1088以使用快速恢复位1028确定快速恢复音高记忆1089,即,用于当前帧的经重构的音高记忆。

最佳音高记忆模块1082可接着使用快速恢复音高记忆1089及先前音高记忆信号1062(从先前帧确定)确定最佳音高记忆1080。此可包括使用快速恢复位1028中的先前预测记忆比较位1068,所述先前预测记忆比较位1068指示先前预测记忆信号1062是否比最佳形状向量1070更好且可用(即,未擦除)。如果比较位1068指示无先前音高记忆信号1062比快速恢复音高记忆1089(从最佳形状向量1070确定)更准确,则可将快速恢复音高记忆1089用作最佳音高记忆1080。另一方面,如果比较位1068指示先前音高记忆信号1062中的至少一者比快速恢复音高记忆1089(从最佳形状向量1070确定)更准确,则可将先前音高记忆信号1062中的一者用作最佳音高记忆1080。如果存在比快速恢复音高记忆1089更好的多个先前音高记忆信号1062,则使用最靠近当前帧的先前音高记忆信号1062。

一旦确定最佳音高记忆1080,其便可用以使用自适应性码簿1014确定自适应性码簿贡献1042。固定码簿索引1084可确定残余信号模块1090中的与自适应性码簿贡献1042组合的固定码簿贡献,以产生用于当前帧的经重构的残余信号1072。LPC模块1008可使用用于当前帧的经发射的LPC参数1086来合成经重构的当前帧1092。

图11说明可包括于发射终端1102内的特定组件。发射终端1102还可称作无线通信装置或基站,且可包括无线通信装置或基站的功能性的一些或全部。举例来说,发射终端1102可为图1中所说明的发射终端102。发射终端1102包括处理器1103。处理器1103可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1103可被称作中央处理单元(CPU)。尽管在图11的发射终端1102中仅展示单一处理器1103,但在替代配置中,可使用处理器的组合(例如,ARM及DSP)。

发射终端1102还包括存储器1105。存储器1105可为能够存储电子信息的任何电子组件。存储器1105可体现为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器一起包括在内的机载存储器、EPROM存储器、EEPROM存储器、寄存器等,包括其组合。

数据1107a及指令1109a可存储于存储器1105中。指令1109a可为可由处理器1103执行以实施本文中所揭示的方法。执行所述指令1109a可涉及使用存储于存储器1105中的数据1107a。当处理器1103执行指令1109a时,指令1109b的各部分可加载到处理器1103上,且数据1107b的各片段可加载到处理器1103上。

发射终端1102还可包括发射器1111及接收器1113以允许将信号发射到发射终端1102以及从发射终端1102接收信号。发射器1111及接收器1113可统称作收发器1115。多个天线1117a到1117b可电耦合到收发器1115。发射终端1102还可包括(未图示)多个发射器、多个接收器、多个收发器及/或额外天线。

发射终端1102可包括数字信号处理器(DSP)1121。发射终端1102还可包括通信接口1123。通信接口1123可允许用户与发射终端1102交互。

发射终端1102的各组件可通过一个或一个以上总线耦合在一起,总线可包括功率总线、控制信号总线、状态信号总线、数据总线等。出于清楚起见,各种总线在图11中说明为总线系统1119。

图12说明可包括于接收终端1204内的特定组件。接收终端1204可为无线通信装置或基站。举例来说,接收终端1204可为图1中所说明的接收终端104。接收终端1204包括处理器1203。处理器1203可为通用单芯片或多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、可编程门阵列等。处理器1203可被称作中央处理单元(CPU)。尽管在图12的接收终端1204中仅展示单一处理器1203,但在替代配置中,可使用处理器的组合(例如,ARM及DSP)。

接收终端1204还包括存储器1205。存储器1205可为能够存储电子信息的任何电子组件。存储器1205可体现为随机存取存储器(RAM)、只读存储器(ROM)、磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器一起包括在内的机载存储器、EPROM存储器、EEPROM存储器、寄存器等,包括其组合。

数据1207a及指令1209a可存储于存储器1205中。指令1209a可为可由处理器1203执行以实施本文中所揭示的方法。执行所述指令1209a可涉及使用存储于存储器1205中的数据1207a。当处理器1203执行指令1209a时,指令1209b的各部分可加载到处理器1203上,且数据1207b的各片段可加载到处理器1203上。

接收终端1204还可包括发射器1211及接收器1213以允许将信号发射到接收终端1204以及从接收终端1204接收信号。发射器1211及接收器1213可统称作收发器1215。多个天线1217a到1217b可电耦合到收发器1215。接收终端1204还可包括(未图示)多个发射器、多个接收器、多个收发器及/或额外天线。

接收终端1204可包括数字信号处理器(DSP)1221。接收终端1204还可包括通信接口1223。通信接口1223可允许用户与接收终端1204交互。

接收终端1204的各组件可通过一个或一个以上总线耦合在一起,总线可包括功率总线、控制信号总线、状态信号总线、数据总线等。出于清楚起见,各种总线在图12中说明为总线系统1219。

本文中所描述的技术可用于各种通信系统,包括基于正交多路复用方案的通信系统。这些通信系统的实例包括正交频分多址(OFDMA)系统、单载波频分多址(SC-FDMA)系统等。OFDMA系统利用正交频分多路复用(OFDM),正交频分多路复用(OFDM)为将整个系统带宽分割成多个正交子载波的调制技术。还可将这些子载波称为载频调、频段等。对于OFDM,每一子载波可用数据独立地调制。SC-FDMA系统可利用交错FDMA(IFDMA)来在分散于系统带宽上的子载波上发射,利用局部FDMA(LFDMA)来在邻近子载波的块上发射,或利用增强型FDMA(EFDMA)来在邻近子载波的多个块上发射。一般来说,对于OFDM,在频域中发送调制符号,且对于SC-FDMA,在时域中发送调制符号。

术语“确定”涵盖广泛多种动作,且因此,“确定”可包括推算、计算、处理、导出、调查、查找(例如,在表、数据库或另一数据结构中查找)、确认及其类似者。而且,“确定”可包括接收(例如,接收信息)、存取(例如,存取存储器中的数据)及其类似者。而且,“确定”可包括解析、选择、挑选、建立及其类似者。

除非另有明确指定,否则短语“基于”不意指“仅基于”。换句话说,短语“基于”描述“仅基于”与“至少基于”两者。

应将术语“处理器”广泛地解释为涵盖通用处理器、中央处理单元(CPU)、微处理器、数字信号处理器(DSP)、控制器、微控制器、状态机等。在一些情况下,“处理器”可指代专用集成电路(ASIC)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)等。术语“处理器”可指代处理装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。

应将术语“存储器”广泛地解释为涵盖能够存储电子信息的任何电子组件。术语“存储器”可指代各种类型的处理器可读媒体,例如随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、快闪存储器、磁性或光学数据存储装置、寄存器等。如果处理器可从存储器读取信息及/或将信息写入到存储器,则称所述存储器与所述处理器电子通信。与处理器成一体式的存储器与所述处理器电子通信。

应将术语“指令”及“代码”广泛地解释为包括任何类型的计算机可读语句。举例来说,术语“指令”及“代码”可指代一个或一个以上程序、例程、子例程、函数、过程等。“指令”及“代码”可包含单一计算机可读语句或许多计算机可读语句。

可以由硬件执行的软件或固件来实施本文中所描述的功能。所述功能可作为一个或一个以上指令存储于计算机可读媒体上。术语“计算机可读媒体”或“计算机程序产品”指代可由计算机或处理器存取的任何有形存储媒体。借助于实例而非限制,计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用于以指令或数据结构的形式载运或存储所要程序代码且可由计算机存取的任何其它媒体。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及光盘,其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。

本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。方法步骤及/或动作可在不脱离权利要求书的范围的情况下彼此互换。换句话说,除非针对正被描述的方法的恰当操作需要步骤或动作的特定次序,否则可在不脱离权利要求书的范围的情况下修改特定步骤及/或动作的次序及/或使用。

此外,应了解,用于执行本文中所描述的方法及技术(例如由图3、4及7说明的那些方法及技术)的模块及/或其它适当装置可由装置下载及/或以其它方式获得。举例来说,可将装置耦合到服务器以促进用于执行本文中所描述的方法的装置的传送。或者,可经由存储装置(例如,随机存取存储器(RAM)、只读存储器(ROM)、例如压缩光盘(CD)或软性磁盘等物理存储媒体等)来提供本文中所描述的各种方法,使得在将所述存储装置耦合或提供到装置后,所述装置可即刻获得所述各种方法。

应理解,权利要求书不限于上文所说明的精确配置及组件。在不脱离权利要求书的范围的情况下,可在本文所描述的系统、方法及设备的布置、操作及细节方面进行各种修改、改变及变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号