首页> 中国专利> 用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的系统和方法

用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的系统和方法

摘要

本发明描述一种用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的方法。接收第一包。分析所述第一包以确定与所述第一包相关联的第一位速率。从所述第一包中废弃与至少一个参数相关联的位。将与一个或一个以上参数相关联的剩余位和特殊识别符封装成与第二位速率相关联的第二包。传输所述第二包。

著录项

  • 公开/公告号CN101573752A

    专利类型发明专利

  • 公开/公告日2009-11-04

    原文格式PDF

  • 申请/专利权人 高通股份有限公司;

    申请/专利号CN200780048732.6

  • 申请日2007-12-27

  • 分类号G10L19/02;G10L19/04;G10L19/14;H04J3/16;

  • 代理机构北京律盟知识产权代理有限责任公司;

  • 代理人刘国伟

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 22:57:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-06-12

    授权

    授权

  • 2009-12-30

    实质审查的生效

    实质审查的生效

  • 2009-11-04

    公开

    公开

说明书

技术领域

本发明的系统和方法大体来说涉及语音处理技术。更明确地说,本发明的系统和方法涉及将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包。

背景技术

通过数字技术的语音传输已变得普遍,尤其在长距离且数字无线电话应用中。此又引起对确定可在维持经重建的语音的所感知质量的同时在信道上发送的信息的最小量的兴趣。用于压缩语音的装置在电信的许多领域中得到应用。电信的一实例为无线通信。无线通信的领域具有许多应用,包括(例如)无绳电话、寻呼机、无线本地回路、例如蜂窝式且便携式通信系统(PCS)电话系统的无线电话、移动因特网协议(IP)电话和卫星通信系统。尤其重要的应用为用于移动订户的无线电话。

发明内容

描述种用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的方法。接收第一包。分析第一包以确定与第一包相关联的第一位速率。从第一包废弃与至少一个参数相关联的位。将与一个或一个以上参数相关联的剩余位和特殊识别符封装成与第二位速率相关联的第二包。传输第二包。

还描述一种用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的设备。所述设备包括处理器和与处理器电子通信的存储器。指令存储于存储器中。指令可经执行以:接收第一包;分析第一包以确定与第一包相关联的第一位速率;从第一包废弃与至少一个参数相关联的位;将与一个或一个以上参数相关联的剩余位和特殊识别符封装成与第二位速率相关联的第二包;以及传输第二包。

还描述一种经配置以将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的系统。所述系统包括用于处理的装置和用于接收第一包的装置。描述用于分析第一包以确定与第一包相关联的第一位速率的装置和用于从第一包废弃与至少一个参数相关联的位的装置。描述用于将与一个或一个以上参数相关联的剩余位和特殊识别符封装成与第二位速率相关联的第二包的装置和用于传输第二包的装置。

还描述一种计算机可读媒体。所述媒体经配置以存储指令集,所述指令经执行以:接收第一包;分析第一包以确定与第一包相关联的第一位速率;从第一包废弃与至少一个参数相关联的位;将与一个或一个以上参数相关联的剩余位和特殊识别符封装成与第二位速率相关联的第二包;以及传输第二包。

还描述一种用于解码包的方法。接收包。读取包括于包中的特殊识别符。发现包从与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包。选择用于包的解码模式。

还描述一种用于将包从全速率弱化成半速率的方法。接收全速率包。通过从全速率包废弃与一参数相关联的位而将全速率包弱化成半速率包。用与信令信息相关联的位封装半速率包。将半速率包传输到解码器。

附图说明

图1说明无线通信系统的一种配置;

图2是说明信号传输环境的一种配置的框图;

图3是说明多模式编码器与多模式解码器通信的一种配置的框图;

图4是说明交互工作功能(IWF)的一种配置的框图;

图5是说明可变速率语音编码方法的一种配置的流程图;

图6是说明包弱化方法的一种配置的流程图;

图6A是说明解码包的一种配置的流程图;

图7A是说明将有声语音帧分割为子帧的图;

图7B是说明将无声语音帧分割为子帧的图;

图7C是说明将暂态语音帧分割为子帧的图;

图8是说明原型音高周期(PPP)编码技术的原理的曲线图;

图9是说明分配给各种类型的包的位数目的图表;

图10是说明全速率PPP包到特殊半速率PPP包的转换的一种配置的框图;以及

图11是通信装置的一种配置中的某些组件的框图。

具体实施方式

现参看图式来描述系统和方法的各种配置,图式中相同参考数字指示相同或功能类似的元件。可以广泛各种不同配置来布置并设计如本文图式中大体描述和说明的本发明的系统和方法的特征。因此,以下详细描述并非希望限制如所主张的系统和方法的范围,而是仅代表系统和方法的配置。

本文中所揭示的配置的许多特征可被实施为计算机软件、电子硬件或两者的组合。为了清楚地说明硬件与软件的此互换性,各种组件大体将依据其功能性而加以描述。此功能性实施为硬件还是软件取决于特定应用和强加于整体系统的设计约束。熟练的技术人员可针对每一特定应用以各种方式实施所描述的功能性,但这些实施决策不应被理解为导致背离本发明的系统和方法的范围。

在所描述的功能性被实施为计算机软件时,此软件可包括位于存储器装置内和/或在系统总线或网络上作为电子信号而传输的任一类型计算机指令或计算机可执行码。实施与本文中所描述的组件相关联的功能性的软件可包含单一指令或许多指令,且可在若干不同码段上、在不同程序之间且越过若干存储器装置而分布。

如本文中所使用,除非另外明确规定,否则术语“配置”、“所述配置”、“一个或一个以上配置”、“一些配置”、“某些配置”、“一个配置”、“另一配置”等意味着“所揭示的系统和方法的一个或一个以上(但未必全部)配置”。

在极广泛的意义上使用术语“确定”(及其语法变体)。术语“确定”涵盖广泛各种动作且因此“确定”可包括计算、处理、导出、调查、查找(例如,在表、数据库或另一数据结构中查找)、确认等。并且,“确定”可包括接收(例如,接收信息)、存取(例如,存取存储器中的数据)等。并且,“确定”可包括解析、选择、挑选、建立等。

除非另外明确规定,否则短语“基于”并非意味着“仅基于”。换句话说,短语“基于”描述“仅基于”和“至少基于”两者。

蜂窝式网络可包括由许多小区构成的无线电网络,所述小区每一者由固定传输器服务。这多个传输器可被称为小区站点或基站。小区可通过在通信信道上向基站传输语音信号而与网络中的其它小区通信。小区可将语音信号划分为多个帧(例如,20毫秒(ms)的语音信号)。每一帧可被编码成包。包可包括特定数量的位,所述位接着越过通信信道而传输到接收基站或接收小区。接收基站或接收小区可拆开所述包且解码各种帧以重建信号。

基站处的交互工作功能(IWF)可在越过通信信道而传输包之前将全速率(171位)包“弱化”成半速率(80位)包。弱化可经实施以用于各种类型的包,包括全速率原型音高周期(PPP)包和全速率码激发线性预测(CELP)包。

在将全速率包弱化成半速率包之后,可将信令信息添加到半速率包。在弱化之后可能未被占用的位可用以传送例如越区切换、用于增加传输功率的消息等额外信令信息。可包括经弱化的语音信息和信令信息的所得包可作为全速率包而发送到解码器。

此外,由高数量的位传输的包可减小蜂窝式网络的容量。可通过在基站处执行包级弱化而改进经重建的语音信号的质量。与擦除全速率PPP包或全速率CELP包相比,将全速率PPP包和全速率CELP包转换(或弱化)成特殊半速率PPP包和特殊半速率CELP包并将这些特殊半速率包传输到解码器可在解码器处改进经重建的语音信号的质量。弱化全速率包还可降低网络业务。

图1说明码分多址(CDMA)无线电话系统100,其可包括:多个移动订户单元102或移动台102、多个基站104、一基站控制器(BSC)106和一移动交换中心(MSC)108。MSC 108可经配置以与常规公共交换电话网络(PSTN)110介接。MSC 108还可经配置以与BSC 106介接。在系统100中可能存在一个以上BSC 106。每一基站104可包括至少一个扇区(未图示),其中每一扇区可具有全向天线或在特定方向径向远离基站104而指向的天线。或者,每一扇区可包括用于分集接收的两个天线。每一基站104可经设计以支持多个频率指派。扇区和频率指派的相交可被称为CDMA信道。移动订户单元102可包括蜂窝式或便携式通信系统(PCS)电话。

在蜂窝式电话系统100的操作期间,基站104可从移动台102的集合接收反向链路信号的集合。移动台102可正在进行电话呼叫或其它通信。可在给定基站104内处理所述基站104接收到的每一反向链路信号。可将所得数据转发到BSC 106。BSC 106可提供呼叫资源分配和移动性管理功能性,包括基站104之间的软越区切换的编排(orchestration)。BSC 106还可将接收到的数据路由到MSC 108,MSC 108提供额外路由服务以用于与PSTN 110介接。类似地,PSTN 110可与MSC 108介接,且MSC 108可与BSC 106介接,BSC 106又可控制基站104以将前向链路信号的集合传输到移动台102的集合。

图2描绘信号传输环境200,其包括编码器202、解码器204、传输媒体206和交互工作功能(IWF)208。编码器202可实施于移动台102内或基站104中。IWF 208可实施于基站104内。解码器204可实施于基站104中或移动台102中。编码器202可编码语音信号s(n)210,进而形成经编码的语音信号senc(n)212。经编码的语音信号212可被转换成特殊经编码的包spenc(n)214以越过传输媒体206传输到解码器204。解码器204可拆开spenc(n)214且解码senc(n)212,借此产生经合成的语音信号(n)216。

如本文中所使用的术语“编码”可通常指代涵盖编码和解码两者的方法。通常,编码系统、方法和设备设法最小化经由传输媒体206而传输的位数目(即,最小化spenc(n)214的带宽)同时维持可接受的语音再现(即,s(n)210s^(n)216)。所述设备可为移动电话、个人数字助理(PDA)、膝上型计算机、数码相机、音乐播放器、游戏装置、基站或具有处理器的任一其它装置。经编码的语音信号212的组成可根据由编码器202利用的特定语音编码模式而改变。以下描述各种编码模式。

以下所描述的编码器202、解码器204和IWF 208的组件可被实施为电子硬件、被实施为计算机软件或两者的组合。这些组件在下文依据其功能性而加以描述。功能性实施为硬件还是软件可取决于特定应用和强加于整体系统的设计约束。传输媒体206可表示许多不同传输媒体,其包括(但不限于)陆基通信线、基站与卫星之间的链路、蜂窝式电话与基站之间或蜂窝式电话与卫星之间的无线通信。

通信的每一方可发射数据以及接收数据。每一方可利用编码器202和解码器204。然而,下文中,信号传输环境200将被描述为在传输媒体206的一末端包括编码器202且在另一末端包括解码器204。

出于此描述的目的,s(n)210可包括在包括不同口声和静默周期的典型对话期间获得的数字语音信号。语音信号s(n)210可被分割成帧,且每一帧可被进一步分割成子帧。在执行某块处理时,可使用这些任意选择的帧/子帧边界。还可能对子帧执行被描述为对帧执行的操作,在此意义上,本文中可互换使用帧与子帧。然而,如果实施连续处理而非块处理,那么s(n)210可能并未被分割成帧/子帧。因而,以下所描述的块技术可扩展到连续处理。

可以8千赫兹(kHz)对信号s(n)210进行数字取样。每一帧可包括20毫秒(ms)的数据或在经取样的8kHz速率下可包括160个样本。每一子帧可包括53或54个样本的数据。虽然这些参数可适于语音编码,但其仅为实例且可使用其它合适的替代性参数。

图3是说明多模式编码器302越过通信信道306而与多模式解码器304通信的一种配置的框图。通信信道306可包括射频(RF)接口。编码器302可包括相关联解码器(未图示)。编码器302及其相关联解码器可形成第一语音编码器。解码器304可包括相关联编码器(未图示)。解码器304及其相关联编码器可形成第二语音编码器。

编码器302可包括初始参数计算模块318、速率确定模块320、模式分类模块322、多个编码模式324、326、328和包格式化模块330。编码模式324、326、328的数目被展示为N,N可表示编码模式324、326、328的任一数目。为了简单起见,展示三个编码模式324、326、328,其中点线指示存在其它编码模式。

解码器304可包括包拆卸器模块332、多个解码模式334、336、338和后滤波器340。解码模式334、336、338的数目被展示为N,N可表示解码模式334、336、338的任一数目。为了简单起见,展示三个解码模式334、336、338,其中点线指示存在其它解码模式。

可将语音信号s(n)310提供到初始参数计算模块318。语音信号310可被划分为被称为帧的样本的块。值n可表示帧号或值n可表示帧中的样本数目。在替代配置中,线性预测(LP)残余错误信号可替代语音信号310而加以使用。可由例如码激发线性预测(CELP)编码器等语音编码器来使用LP残余错误信号。

初始参数计算模块318可基于当前帧而导出各种参数。在一个方面中,这些参数包括以下参数中的至少一者:线性预测编码(LPC)滤波器系数、线频谱对(LSP)系数、标准化自相关函数(NACF)、开环滞后、零交叉速率、带能量和共振峰残余信号。

初始参数计算模块318可耦合到模式分类模块322。模式分类模块322可在编码模式324、326、328之间动态地切换。初始参数计算模块318可将参数提供到模式分类模块322。模式分类模块322可耦合到速率确定模块320。速率确定模块320可接受速率命令信号。速率命令信号可指导编码器302以特定速率编码语音信号310。在一个方面中,特定速率包括全速率,其可指示使用一百七十一个位来编码语音信号310。在另一实例中,特定速率包括半速率,其可指示使用八十个位来编码语音信号310。在又一实例中,特定速率包括八分之一速率,其可指示使用十六个位来编码语音信号310。

如先前所陈述,模式分类模块322可经耦合以在逐个帧基础上在编码模式324、326、328之间动态地切换以便选择用于当前帧的最适当编码模式324、326、328。模式分类模块322可通过将参数与预定义阈值和/或最高值进行比较而选择用于当前帧的特定编码模式324、326、328。此外,模式分类模块322可基于从速率确定模块320接收的速率命令信号而选择特定编码模式324、326、328。举例来说,编码模式A 324可使用一百七十一个位来编码语音信号310,而编码模式B 326可使用八十个位来编码语音信号310。

基于帧的能量含量,模式分类模块322可将帧分类为非语音或非主动语音(例如,静默、背景噪音或词之间的暂停)或语音。基于帧的周期性,模式分类模块322可将语音帧分类为特定类型的语音,例如,有声语音、无声语音或暂态语音。

有声语音可包括显现相对高程度的周期性的语音。在图7A的曲线图中展示有声语音702的区段。如所说明,音高周期可为可用以分析且重建帧的内容的语音帧的分量。无声语音可包括子音(consonant sound)。在图7B的曲线图中展示无声语音704的区段。暂态语音帧可包括有声语音与无声语音之间的过渡。在图7C的曲线图中展示暂态语音706的区段。既未分类为有声语音也未分类为无声语音的帧可被分类为暂态语音。下文将更详细地论述图7A、图7B和图7C中所说明的曲线图。

将语音帧进行分类可允许不同编码模式324、326、328用以编码不同类型的语音,进而导致在例如通信信道306的共享信道中较有效地使用带宽。举例来说,因为有声语音为周期性的且因此为高度可预测的,所以低位速率的高度可预测的编码模式324、326、328可用以编码有声语音。

模式分类模块322可基于帧的分类而选择用于当前帧的编码模式324、326、328。各种编码模式324、326、328可并联耦合。编码模式324、326、328中的一者或一者以上在任一给定时间可为可操作的。在一种配置中,根据当前帧的分类而选择一个编码模式324、326、328。

不同编码模式324、326、328可根据不同编码位速率、不同编码方案或编码位速率与编码方案的不同组合来操作。如先前所陈述,所使用的各种编码速率可为全速率、半速率、四分之一速率和/或八分之一速率。所使用的各种编码方案可为CELP编码、原型音高周期(PPP)编码(或波形内插(WI)编码)和/或噪音激发线性预测(NELP)编码。因此,举例来说,特定编码模式324、326、328可为全速率CELP,另一编码模式324、326、328可为半速率CELP,另一编码模式324、326、328可为四分之一速率PPP,且另一编码模式324、326、328可为NELP。

根据CELP编码模式324、326、328,可由LP残余信号的量化型式激发线性预测声道模型。在CELP编码模式中,可量化整个当前帧。CELP编码模式324、326、328可提供相对精确的语音再现但以相对高的编码位速率为代价。CELP编码模式324、326、328可用以编码分类为暂态语音的帧。

根据NELP编码模式324、326、328,经滤波的伪随机噪音信号可用以模型化LP残余信号。NELP编码模式324、326、328可为实现低位速率的相对简单的技术。NELP编码模式324、326、328可用以编码分类为无声语音的帧。

根据PPP编码模式324、326、328,可编码每一帧内的音高周期的子集。可通过在这些原型周期之间内插而重建语音信号的剩余周期。在PPP编码的时域实施中,可计算描述如何修改先前原型周期以接近当前原型周期的第一参数集合。可选择一个或一个以上码向量,当对所述一个或一个以上码向量进行求和时,其接近当前原型周期与经修改的先前原型周期之间的差。第二参数集合描述这些选定的码向量。在PPP编码的频域实施中,一参数集合可经计算以描述原型的振幅和相位谱。根据PPP编码的实施,解码器304可通过基于描述振幅和相位的所述参数集合来重建当前原型而合成输出语音信号316。可在当前经重建的原型周期与先前经重建的原型周期之间的区域上内插语音信号。原型可包括将由来自先前帧的原型(其类似地定位于帧内)线性内插的当前帧的一部分以便在解码器304处重建语音信号310或LP残余信号(即,使用过去的原型周期作为当前原型周期的预测子(predictor))。

编码原型周期而非整个语音帧可减小编码位速率。可使用PPP编码模式324、326、328来有利地编码分类为有声语音的帧。如图7A中所说明,有声语音可包括由PPP编码模式324、326、328采用的缓慢时变的周期性分量。通过采用有声语音的周期性,PPP编码模式324、326、328可实现低于CELP编码模式324、326、328的位速率的位速率。

选定的编码模式324、326、328可耦合到包格式化模块330。选定的编码模式324、326、328可编码或量化当前帧且将经量化的帧参数312提供到包格式化模块330。包格式化模块330可将经量化的帧参数312组合成经格式化的包313。包格式化模块330可耦合到IWF 308。包格式化模块330可将经格式化的包313提供到IWF 308。IWF 308可将经格式化的包313转换成特殊包314。在一个实例中,经格式化的包313包括由CELP、PPP或NELP编码模式324、326、328编码的全速率包。IWF 308可将全速率经格式化的包313转换成特殊半速率包314。换句话说,全速率经格式化的包(171个位)313可被转换成包括80个位的半速率包。半速率包不需要准确地具有全速率包的位的数目的一半。IWF 308可将特殊半速率包314提供到传输器(未图示)且特殊包314可被转换成模拟格式、经调制且在通信信道306上传输到接收器(也未图示),所述接收器接收、解调制且数字化特殊包314,且将包314提供到解码器304。

在解码器304中,包拆卸器模块332从接收器接收特殊包314。包拆卸器模块332可拆开特殊包314且发现特殊包314已从全速率包转换成半速率包。模块332可通过读取包括于特殊包中的特殊识别符而发现已转换特殊包。包拆卸器模块332还可经耦合以在逐个包基础上在解码模式334、336、338之间动态地切换。解码模式334、336、338的数目可与编码模式324、326、328的数目相同。每一经编号的编码模式324、326、328可与经配置以使用同一编码位速率和编码方案的相应经类似编号的解码模式334、336、338相关联。

如果包拆卸器模块332检测到包314,那么包314被拆卸且提供到相关解码模式334、336、338。如果包拆卸器模块332未检测到包,那么宣告包损失且擦除解码器(未图示)可执行帧擦除处理。解码模式334、336、338的并联阵列可耦合到后滤波器340。相关解码模式334、336、338可解码或解量化包314且将信息提供到后滤波器340。后滤波器340可重建或合成语音帧,进而输出经合成的语音帧(n)316。

在一种配置中,并不传输经量化的参数本身。相反,传输规定解码器304中的各种查找表(LUT)(未图示)中的地址的码簿、索引。解码器304可接收码簿索引且搜索各种码簿LUT以获得适当参数值。因此,可传输参数(例如,音高滞后、适应性码簿增益和LSP)的码簿索引,且可由解码器304搜索三个相关联码簿LUT。

根据CELP编码模式,可传输音高滞后、振幅、相位和LSP参数。因为可在解码器304处合成LP残余信号,所以传输LSP码簿索引。另外,可传输当前帧的音高滞后值与先前帧的音高滞后值之间的差。

根据其中将在解码器304处合成语音信号310的PPP编码模式,传输音高滞后、振幅和相位参数。由PPP语音编码技术使用的较低位速率可能不准许传输绝对音高滞后信息和相对音高滞后差值两者。

根据一个实例,以低位速率PPP编码模式传输例如有声语音帧等高周期性帧,低位速率PPP编码模式量化当前帧的音高滞后值与先前帧的音高滞后值之间的差以用于传输,且并不量化当前帧的音高滞后值以用于传输。因为有声帧本质上为高周期性的,所以传输与绝对音高滞后值相反的差值可允许实现较低编码位速率。在一个方面中,此量化经广义化以使得先前帧的参数值的经加权和被计算,其中权重的和为一,且从当前帧的参数值减去经加权和。接着可量化所述差。

图4是说明IWF 408的一个实例的框图。IWF 408可将全速率经格式化的包413转换成特殊半速率包414。IWF 408可接收经格式化的包413,且位速率分析器450可确定包括于经格式化的包413中的位的数目。在一个方面中,全速率经格式化的包413包括一百七十一个位。废弃模块452可消除与由经格式化的包413包括的经量化的参数相关联的特定数量的位。在一种配置中,位确定器456确定从经格式化的包413废弃哪些位。举例来说,位确定器456可确定将废弃与带对准参数相关联的位。因而,废弃模块452可消除与此参数相关联的数量的位。

IWF 408还可包括封装模块454。封装模块454可将未由废弃模块452废弃的剩余位封装成特殊包414。在一个方面中,废弃模块452消除由经格式化的包413包括的位的相对一半。因而,封装模块454可将剩余位封装成特殊包414,所述特殊包包括由经格式化的包413包括的位数目的一半的位。识别符产生器458可将特殊识别符提供到封装模块454。封装模块454可包括与特殊包414中的特殊识别符相关联的位。特殊识别符可向解码器304指示传入包为特殊半速率包414。特殊识别符可包括范围在值101与127之间的7位值。特殊识别符在编码器通常向包指派范围在0到100之间的7位值的意义上可为非法值。具有范围在101与127之间的7位值的包可向解码器304指示在编码过程之后包已从全速率转换成特殊半速率。

图5是说明可变速率语音编码方法500的一个实例的流程图。在一个方面中,方法500由单一移动台102来实施,所述单一移动台102可经启用以接收全速率包且将所述包转换成特殊半速率包。在其它方面中,方法500可由一个以上移动台102来实施。换句话说,一个移动台102可包括编码器以编码全速率包,而单独移动台102、基站104等包括可将全速率包转换成特殊半速率包的IWF。可计算当前帧的初始参数502。在一种配置中,初始参数计算模块318计算参数502。参数可包括以下参数中的一者或一者以上:线性预测编码(LPC)滤波器系数、线频谱对(LSP)系数、标准化自相关函数(NACF)、开环滞后、带能量、零交叉速率和共振峰残余信号。

当前帧可被分类为主动或非主动的504。在一种配置中,分类模块322将当前帧分类为包括“主动”语音或“非主动”语音。如上所述,s(n)310可包括语音周期和静默周期。主动语音可包括讲出的词,而非主动语音可包括所有其它物,例如,背景噪音、静默、暂停。

确定当前帧被分类为主动的还是非主动的506。如果当前帧被分类为主动的,那么主动语音进一步被分类为有声帧、无声帧或暂态帧508。可以许多不同方式分类人类语音。语音的两种分类可包括有声声音和无声声音。并非为有声语音或无声语音的语音可被分类为暂态语音。

可基于在步骤506和508中进行的帧分类而选择编码器/解码器模式510。如图3中所示,可并联连接各种编码器/解码器模式。不同编码器/解码器模式根据不同编码方案来操作。某些模式可在展现特定性质的语音信号s(n)310的编码部分处较有效。

如先前所解释,CELP模式可经选择以编码分类为暂态语音的帧。PPP模式可经选择以编码分类为有声语音的帧。NELP模式可经选择以编码分类为无声语音的帧。在可变等级的性能的情况下,同一编码技术可以不同位速率频繁操作。图3中的不同编码器/解码器模式可表示不同编码技术、或以不同位速率操作的同一编码技术或上述的组合。

选定的编码器模式可编码当前帧512且根据第一速率而将经编码的帧格式化成包514。确定是否需要弱化和突发信令信息516。此外,确定是否需要额外网络容量516。如果不需要信令或额外网络容量,那么可将包发送到解码器520。如果需要信令或额外网络容量,那么包在基站中可从第一速率弱化成第二速率518,且接着可在发送到解码器520之前以信令信息来封装。第一速率可包括大于第二速率的位数量的位数量。在一个方面中,弱化包518包括:从包废弃特定数量的位,使得较小数目的位被传输到解码器或以便释放可用以将信令信息发送到解码器的位。

图6是说明包弱化方法600的一个实例的流程图。方法600可由IWF 208来实施。可接收第一包602。第一包可为从编码器302接收的经格式化的包313。第一包可经分析604以便确定与第一包相关联的第一位速率。第一位速率可指示包括于第一包中的位的数目。在一个方面中,位速率分析器450分析第一包以便确定位速率。可从第一包废弃与至少一个参数相关联的位606。在一种配置中,废弃模块452废弃与带对准参数相关联的位。在PPP编码的频域实施中,多带方法可经采用以编码相位谱,其中相位量化被变换成一系列线性相移的量化。离散傅立叶系列(DFS)变换可用以将原型音高周期(PPP)变换成频域。可计算经振幅量化、未经相位量化的DFS与经振幅量化、零相位的DFS之间的全局对准位移。可将经振幅量化、零相位DFS移位此全局对准的负数,其可对应于向由经振幅量化、零相位的DFS表示的PPP施加预期线性相移以最大程度地与可对应于经振幅量化、实际相位DFS的目标PPP对准。在一个方面中,线性相移可能不足以捕获所有谐波的实际相位,除全局对准外还在多个带中计算带聚焦对准。此可对应于可被废弃的带对准参数。

与一个或一个以上参数相关联的第一包中的剩余位可与特殊识别符一起封装成第二包608。在一个方面中,第二包与第二位速率相关联。第二位速率可包括少于第一位速率的位的位。特殊识别符可将第二包识别成包括第二位速率。可将第二包传输到解码器610。在一个实例中,第二包可从第一基站传输到第二基站610。在另一实例中,第二包可从第一基站传输610到另一移动台102。

图6A是说明解码包的方法601的一种配置的流程图。可接收包603,且可读取由包包括的特殊识别符605。在一个方面中,特殊识别符为非法滞后识别符。可发现包从与第一位速率相关联的第一包转换成与第二位速率相关联的第二包607。可选择用于包的解码模式609且可解码包。

图7A描绘包括有声语音702的信号s(n)310的实例部分。有声声音可通过以下方式而产生:使用经调整以便以松弛振荡振动的声带的张力来强制空气通过声门,借此产生激发声道的空气的准周期性脉冲。如图7A中所示,有声语音中所测量的一个性质为音高周期。

图7B描绘包括无声语音704的信号s(n)310的实例部分。无声声音可通过以下方式而产生:在声道中的某一点(通常朝向口端)处形成收缩且强制空气以足够高的速度通过收缩以产生紊流。所得无声语音信号类似有色噪音。

图7C描绘包括暂态语音706(即,既非有声也非无声的语音)的信号s(n)310的实例部分。展示于图7C中的实例暂态语音706可表示在无声语音与有声语音之间过渡的s(n)310。根据本文中所描述的技术,可使用许多不同语音分类以实现可比较的结果。

图8的曲线图说明PPP编码技术的原理。单一帧800可包括原始信号s(n)860。可从原始信号860检索音高周期862(或原型波形)且进行编码。经编码的音高周期862可用以产生经重建的信号864。经重建的信号864可为原始信号860的重建。可通过在音高周期862之间内插而重建未经编码的原始信号860的部分866。

图9是说明分配给各种类型的包的位数目的图表900。图表900包括多个参数902。多个参数902内的每一参数可利用特定数目的位。可能已利用先前论述的各种编码模式中的一者来编码图表900中所说明的各种包类型。包类型可包括全速率CELP(FCELP)904、半速率CELP(HCELP)906、特殊半速率CELP(SPLHCELP)908、全速率PPP(FPPP)910、特殊半速率PPP(SPLHPPP)912、四分之一速率PPP(QPPP)914、特殊半速率NELP(SPLHNELP)916、四分之一速率NELP(QNELP)918和静默编码器920。

FCELP 904和FPPP 910可为具有总计171个位的包。FCELP 904包可被转换成SPLHCELP 908包。在一个方面中,FCELP 904包向例如固定码簿索引(FCB索引)和固定码簿增益(FCB增益)的参数分配位。如图所示,当FCELP 904包被转换成SPLHCELP908包时,针对例如FCB索引、FCB增益和增量滞后的参数分配零位。换句话说,在不具有这些位的情况下,将SPLHCELP 908包传输到解码器。SPLHCELP 908包包括针对例如以下参数分配的位:线频谱对(LSP)、适应性码簿(ACB)增益、特殊识别(ID)、特殊包ID、音高滞后和模式位信息。传输到解码器的位的总数可从171减小到80。

类似地,FPPP 910包可被转换成SPLHPPP 912包。如图所示,FPPP 910包将位分配给带对准参数。当FPPP 910包被转换成SPLHPPP 912包时,可废弃分配给带对准的位。换句话说,在不具有这些位的情况下,将SPLHPPP 912包传输到解码器。传输到解码器的位的总数可从171减小到80。在一种配置中,分配给振幅和全局对准参数的位包括于SPLHPPP 912包中。振幅参数可指示信号s(n)310的频谱的振幅,且如先前提及的全局对准参数可表示可确保最大对准的线性相移。在一个方面中,整个信号s(n)310在50Hz到4kHz的频率范围内。

此外,SPLHCELP 908、SPLHPPP 912和SPLHNELP 916包可包括分配给非法滞后参数的位。非法滞后参数可表示允许解码器将SPLHCELP 908和SPLHPPP 912包辨别成在编码之后从全速率转换成半速率的包或包括NELP帧的半速率帧的特殊识别符。

针对不同参数和包使用不同位数目来说明本文中的各种配置。与本文中每一参数相关联的特定位数目是举例说明的,且并不意味着具有限定性。参数可包括多于或少于本文中使用的实例的位。

图10是说明全速率原型音高周期(PPP)包1002到特殊半速率PPP(SPLHPPP)包1020的转换的框图。转换可由IWF 1008来实施。FPPP包1002可包括与特定数目的位相关联的若干参数。FPPP包1002中所包括的参数可包括可被分配有单个位的模式位1004、可被分配有28个位的线频谱对(LSP)1006、可被分配有7个位的音高滞后1010、可被分配有28个位的振幅1012、可被分配有7个位的全局对准1014、可被分配有99个位的带对准1016和可被分配有1个位的保留参数1018。在一个方面中,FPPP包1002包括总计171个位。

如先前所论述,IWF 1008可将FPPP包1002转换成SPLHPPP包1020。一旦被转换,SPLHPPP包1020就可包括总计80个位。IWF 1008可废弃分配给带对准1016的位。此外,IWF 1008可在SPLHPPP包1020中包括特殊半速率ID 1022,所述特殊半速率ID 1022可被分配有2个位。另外,IWF 1008可在SPLHPPP包1020中包括非法滞后识别符1024,其可充当特殊包识别符。非法滞后识别符1024可被分配有7个位且可允许解码器将包辨别成从FPPP 1002转换成SPLHPPP 1020的包。在另一配置中,分配给非法滞后识别符1024的7个位可表示在101到127的范围内的值。另外,IWF 1008可包括可被分配有7个位的额外滞后。此可为来自FPPP包的音高滞后。

虽然图10中所说明的实例包括FPPP包1002到SPLHPPP包1020的转换,但应理解,全速率码激发线性预测(FCELP)包也可被转换成特殊半速率CELP(SPLHCELP)包。从FCELP包到SPLHCELP包的转换可以如参考FPPP包到SPLHPPP包的转换而描述的类似方式来进行。FCELP包可包括171个位,且SPLHCELP包可包括80个位。

图11是通信装置1102的实例中的特定组件的框图。在图11中所示的实例中,通信装置1102可为基站和/或移动台。本发明的系统和方法可实施于通信装置中。

如图所示,装置1102可包括控制装置1102的操作的处理器1160。可包括只读存储器(ROM)和随机存取存储器(RAM)两者的存储器1162可将指令和数据提供到处理器1160。存储器1162的一部分还可包括非易失性随机存取存储器(NVRAM)。

装置1102还可包括传输器1164和接收器1166以允许在装置1102与例如小区站点控制器或移动台102的远程位置之间发射并接收数据220。传输器1164和接收器1166可组合成收发器1168。天线1170电耦合到收发器1168。

装置1102还可包括信号检测器1172,其用以检测并量化由收发器1168接收的信号的电平。信号检测器1172将这些信号检测为总能量信号、每一伪噪音(PN)码片的导频能量信号、功率谱密度信号和其它信号。装置1102还可包括包确定器1176,其用以确定哪些包应从全速率包转换成特殊半速率包。

装置1102的各种组件由总线系统1178耦合在一起,所述总线系统1178除包括数据总线外还可包括电力总线、控制信号总线和状态信号总线。然而,为了清楚起见,各种总线在图11中被说明为总线系统1178。

可使用各种不同技艺和技术中的任一者来表示信息和信号。举例来说,可贯穿以上描述而引用的数据、指令、命令、信息、信号、位、符号和码片可由电压、电流、电磁波、磁场或粒子、光场或粒子或其任一组合来表示。

结合本文中所揭示的配置而描述的各种说明性逻辑块、模块、电路和算法步骤可被实施为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件与软件的此互换性,各种说明性组件、块、模块、电路和步骤在上文已大体上依据其功能性而加以描述。此功能性实施为硬件还是软件取决于特定应用和强加于整体系统的设计约束。熟练的技术人员可针对每一特定应用以各种方式实施所描述的功能性,但这些实施决策不应被理解为导致背离本发明的系统和方法的范围。

结合本文中所揭示的配置而描述的各种说明性逻辑块、模块和电路可由经设计以执行本文中所描述的功能的以下各物来实施或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或其任一组合。通用处理器可为微处理器,但在替代方案中,处理器可为任一常规处理器、控制器、微控制器或状态机。处理器还可被实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、与一DSP核心结合的一个或一个以上微处理器或任一其它此类配置。

结合本文中所揭示的配置而描述的方法或算法的步骤可直接以硬件、以由处理器执行的软件模块中或以两者的组合实施。软件模块可驻存于RAM存储器、快闪存储器、ROM存储器、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移除式盘、紧密光盘只读存储器(CD-ROM)或此项技术中已知的任一其它形式的存储媒体。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息且向存储媒体写入信息。在替代方案中,存储媒体可与处理器成一体式。处理器和存储媒体可驻存于ASIC中。ASIC可驻存于用户终端中。在替代方案中,处理器和存储媒体可作为离散组件而驻存于用户终端中。

本文中所揭示的方法包含用于实现所描述的方法的一个或一个以上步骤或动作。方法步骤和/或动作可彼此互换而不背离本发明的系统和方法的范围。换句话说,除非针对配置的适当操作而规定步骤或动作的特定次序,否则可修改特定步骤和/或动作的次序和/或使用而不背离本发明的系统和方法的范围。本文中所揭示的方法可以硬件、软件或两者实施。硬件和存储器的实例可包括RAM、ROM、EPROM、EEPROM、快闪存储器、光盘、寄存器、硬盘、可移除式盘、CD-ROM或任何其它类型的硬件和存储器。

虽然已说明并描述本发明的系统和方法的特定配置和应用,但应理解,系统和方法并不限于本文中所揭示的精确配置和组件。在不背离所主张的系统和方法的精神和范围的情况下,可对本文中所揭示的方法和系统的布置、操作以及细节进行对于所属领域的技术人员来说将显而易见的各种修改、改变和变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号