首页> 中国专利> 用于减低潜在的帧不稳定性的系统和方法

用于减低潜在的帧不稳定性的系统和方法

摘要

本发明描述一种用于通过电子装置减低潜在的帧不稳定性的方法。所述方法包含获得在时间上在被抹除帧之后的帧。所述方法也包含确定所述帧是否潜在地不稳定。所述方法进一步包含在所述帧潜在地不稳定的情况下应用替代加权值以产生稳定帧参数。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-05-18

    授权

    授权

  • 2015-11-18

    实质审查的生效 IPC(主分类):G10L19/005 申请日:20130903

    实质审查的生效

  • 2015-10-21

    公开

    公开

说明书

相关申请案

本申请案与2013年2月21日申请的美国临时专利申请案第61/767,431号“用于校 正潜在线谱频率不稳定性的系统和方法(SYSTEMS AND METHODS FOR  CORRECTING A POTENTIAL LINE SPECTRAL FREQUENCY INSTABILITY)”有关且 主张其优先权。

技术领域

本发明大体上涉及电子装置。更具体地说,本发明涉及用于减低潜在的帧不稳定性 的系统和方法。

背景技术

最近几十年中,电子装置的使用已变得普遍。明确地说,电子技术的进展已降低了 愈加复杂且有用的电子装置的成本。成本降低和消费者需求已使电子装置的使用剧增, 使得其在现代社会中几乎随处可见。由于电子装置的使用已推广开来,因此具有对电子 装置的新的且改善的特征的需求。更具体地说,人们常常寻求执行新功能和/或更快、更 高效且以更高质量执行功能的电子装置。

一些电子装置(例如,移动电话、智能型手机、音频记录器、摄录影机、计算机等) 利用音频信号。这些电子装置可编码、存储和/或发射音频信号。例如,智能型手机可获 得、编码和发射用于电话呼叫的语音信号,同时另一智能型手机可接收所述语音信号并 对其进行解码。

然而,在音频信号的编码、发射和解码中存在特定挑战。例如,音频信号可经编码 以便减小发射所述音频信号所需的频宽量。当音频信号的一部分在传输中丢失时,可能 难以呈现准确地解码的音频信号。从此论述可了解,改善解码的系统和方法可为有益的。

发明内容

描述一种用于通过一电子装置减低潜在的帧不稳定性的方法。所述方法包含获得在 时间上在被抹除帧之后的帧。所述方法也包含确定所述帧是否潜在地不稳定。所述方法 进一步包含在所述帧潜在地不稳定的情况下应用替代加权值以产生稳定帧参数。所述帧 参数可为帧中间线谱频率向量。所述方法可包含应用所接收的加权向量来产生当前帧中 间线谱频率向量。

所述替代加权值可在0与1之间。产生所述稳定帧参数可包含将所述替代加权值应 用于当前帧末端线谱频率向量和先前帧末端线谱频率向量。产生所述稳定帧参数可包含 确定替代当前帧中间线谱频率向量,所述替代当前帧中间线谱频率向量等于当前帧末端 线谱频率向量与所述替代加权值的乘积加上先前帧末端线谱频率向量与1减所述替代加 权值的差的乘积。所述替代加权值可基于两个帧的分类和所述两个帧之间的线谱频率差 中的至少一者加以选择。

确定所述帧是否潜在地不稳定可基于当前帧中间线谱频率在任何重排序之前是否 是根据规则进行排序。确定所述帧是否潜在地不稳定可基于所述帧是否在所述被抹除帧 之后的阈值数目个帧内。确定所述帧是否潜在地不稳定可基于所述帧与所述被抹除帧之 间的任何帧是否利用非预测性量化。

也描述一种用于减低潜在的帧不稳定性的电子装置。所述电子装置包含帧参数确定 电路,所述帧参数确定电路获得在时间上在被抹除帧之后的帧。所述电子装置也包含耦 合到所述帧参数确定电路的稳定性确定电路。所述稳定性确定电路确定所述帧是否潜在 地不稳定。所述电子装置进一步包含耦合到所述稳定性确定电路的加权值替代电路。所 述加权值替代电路在所述帧潜在地不稳定的情况下应用替代加权值以产生稳定帧参数。

也描述一种用于减低潜在的帧不稳定性的计算机程序产品。所述计算机程序产品包 含具有指令的非暂时性有形计算机可读媒体。所述指令包含用于使电子装置获得在时间 上在被抹除帧之后的帧的代码。所述指令也包含用于使所述电子装置确定所述帧是否潜 在地不稳定的代码。所述指令进一步包含用于使所述电子装置在所述帧潜在地不稳定的 情况下应用替代加权值以产生稳定帧参数的代码。

也描述一种用于减低潜在的帧不稳定性的设备。所述设备包含用于获得在时间上在 被抹除帧之后的帧的装置。所述设备也包含用于确定所述帧是否潜在地不稳定的装置。 所述设备进一步包含用于在所述帧潜在地不稳定的情况下应用替代加权值以产生稳定 帧参数的装置。

附图说明

图1为说明编码器和解码器的通用实例的框图;

图2为说明编码器和解码器的基本实施方案的实例的框图;

图3为说明宽带语音编码器和宽带语音解码器的实例的框图;

图4为说明编码器的更特定实例的框图;

图5为说明随时间推移的帧的实例的图;

图6为说明用于通过编码器对语音信号进行编码的方法的一个配置的流程图;

图7为说明线谱频率(LSF)向量确定的实例的图;

图8包含说明LSF内插和外插的实例的两个图;

图9为说明用于通过解码器对经编码语音信号进行解码的方法的一个配置的流程图;

图10为说明群集LSF维度的一个实例的图;

图11为说明归因于群集LSF维度的伪声的实例的曲线图;

图12为说明经配置以用于减低潜在的帧不稳定性的电子装置的一个配置的框图;

图13为说明用于减低潜在的帧不稳定性的方法的一个配置的流程图;

图14为说明用于减低潜在的帧不稳定性的方法的更特定配置的流程图;

图15为说明用于减低潜在的帧不稳定性的方法的另一更特定配置的流程图;

图16为说明用于减低潜在的帧不稳定性的方法的另一更特定配置的流程图;

图17为说明合成语音信号的实例的曲线图;

图18为说明无线通信装置的一个配置的框图,在所述无线通信装置中可实施用于 减低潜在的帧不稳定性的系统和方法;和

图19说明可用于电子装置中的各种组件。

具体实施方式

现参考诸图描述各种配置,在诸图中,相似参考数字可指示功能上类似的元件。可 以多种不同配置来布置和设计如诸图中所大体描述和说明的系统和方法。因此,对如诸 图中所表示的若干配置的以下更详细描述并不希望限制如所主张的范围,而仅表示系统 和方法。

图1为说明编码器104和解码器108的通用实例的框图。编码器104接收语音信号 102。语音信号102可为在任何频率范围中的语音信号。例如,语音信号102可为具有0 千赫兹(kHz)到24kHz的大致频率范围的全频带信号、具有0kHz到16kHz的大致频率 范围的超宽带信号、具有0kHz到8kHz的大致频率范围的宽带信号、具有0kHz到4kHz 的大致频率范围的窄频信号、具有50赫兹(Hz)到300Hz的大致频率范围的低频信号或 具有4kHz到8kHz的大致频率范围的高频信号。语音信号102的其它可能频率范围包 含300Hz到3400Hz(例如,公众交换电话网络(PSTN)的频率范围)、14kHz到20kHz、 16kHz到20kHz和16kHz到32kHz。在一些配置中,语音信号102可以16kHz进行 采样,且可具有0kHz到8kHz的大致频率范围。

编码器104对语音信号102进行编码以产生经编码语音信号106。大体来说,经编 码语音信号106包含表示语音信号102的一或多个参数。所述参数中的一或多者可经量 化。所述一或多个参数的实例包含滤波参数(例如,加权因数、线谱频率(LSF)、线谱对 (LSP)、导抗谱频率(ISF)、导抗谱对(ISP)、部分相关(PARCOR)系数、反射系数和/或对 数面积比率值(log-area-ratio value)等),和包含于经编码激发信号中的参数(例如,增益因 数、自适应性码本索引、自适应性码本增益、固定码本索引和/或固定码本增益等)。所 述参数可对应于一或多个频带。解码器108对经编码语音信号106进行解码以产生经解 码语音信号110。例如,解码器108基于包含于经编码语音信号106中的一或多个参数 而构建经解码语音信号110。经解码语音信号110可为原始语音信号102的大致重现。

编码器104可以硬件(例如,电路)、软件或两者的组合加以实施。例如,编码器104 可实施为专用集成电路(ASIC)或具有指令的处理器。类似地,解码器108可以硬件(例如, 电路)、软件或两者的组合加以实施。例如,解码器108可实施为专用集成电路(ASIC) 或具有指令的处理器。编码器104与解码器108可实施于单独电子装置上或相同电子装 置上。

图2为说明编码器204和解码器208的基本实施方案的实例的框图。编码器204可 为结合图1描述的编码器104的一个实例。编码器204可包含分析模块212、系数变换 214、量化器A 216、反量化器A 218、反系数变换A 220、分析滤波器222和量化器B 224。 编码器204和/或解码器208的组件中的一或多者可以硬件(例如,电路)、软件或两者的 组合加以实施。

编码器204接收语音信号202。应注意,语音信号202可包含如上文结合图1所述 的任何频率范围(例如,语音频率的整个频带或语音频率的子频带)。

在此实例中,分析模块212将语音信号202的频谱包封编码为一组线性预测(LP)系 数(例如,分析滤波器系数A(z)、其可应用于产生全极滤波器1/A(z),其中z为复数(complex  number))。分析模块212通常将输入信号作为语音信号202的一系列非重叠帧处理,其 中针对每一帧或子帧计算一组新系数。在一些配置中,帧周期可为可预期语音信号202 在其内在本地静止的周期。帧周期的一个常见实例为20毫秒(ms)(例如,在8kHz的采 样率下等效于160个样本)。在一个实例中,分析模块212经配置以计算一组十个线性预 测系数来表征每一20ms帧的共振峰结构。也有可能实施分析模块212以将语音信号202 作为一系列重叠帧处理。

分析模块212可经配置以直接分析每一帧的样本,或可首先根据开窗函数(例如,汉 明窗(Hamming window))来对样本进行加权。也可在大于帧的窗(例如30ms窗)内执行分 析。此窗可为对称的(例如,5-20-5,使得其紧接20毫秒帧之前和之后包含5毫秒)或不 对称的(例如,10-20,使得其包含前一帧之后10毫秒)。分析模块212通常经配置以使 用列文逊-杜宾(Levinson-Durbin)递回或勒鲁-盖恩(Leroux-Gueguen)算法来计算线性预测 系数。在另一实施方案中,分析模块可经配置以针对每一帧计算一组倒频谱系数而非一 组线性预测系数。

通过量化所述系数,编码器204的输出速率可显著减小,而对重现质量具有相对较 小的影响。线性预测系数难以高效地量化,且通常映射到例如LSF的另一表示以用于量 化和/或熵编码。在图2的实例中,系数变换214将系数的组变换成对应LSF向量(例如, 一组LSF维度)。系数的其它一对一表示包含LSP、PARCOR系数、反射系数、对数面 积比率值、ISP和ISF。例如,ISF可用于GSM(全球移动通信系统)、AMR-WB(自适应 性多速率宽带)编解码器中。为方便起见,术语“线谱频率”、“LSF维度”、“LSF向量” 和相关术语可用以指LSF、LSP、ISF、ISP、PARCOR系数、反射系数和对数面积比率 值中的一或多者。通常,一组系数与对应LSF向量之间的变换是可逆的,但一些配置可 包含其中变换不可逆而无错误的编码器204实施方案。

量化器A 216经配置以量化LSF向量(或其它系数表示)。编码器204可输出此量化 的结果作为滤波参数228。量化器A 216通常包含向量量化器,所述向量量化器将输入 向量(例如,LSF向量)编码为对表或码本中的对应向量条目的索引。

如图2中所见,编码器204也通过使语音信号202传递经过根据系数的集合加以配 置的分析滤波器222(也称为白化或预测错误滤波器)而产生残余信号。分析滤波器222 可实施为有限脉冲响应(FIR)滤波器或无限脉冲响应(IIR)滤波器。此残余信号将通常含有 未表示于滤波参数228中的语音帧的对感知重要的信息,例如与音调相关的长期结构。 量化器B 224经配置以计算此残余信号的经量化表示用于作为经编码激发信号226而输 出。在一些配置中,量化器B 224包含向量量化器,所述向量量化器将输入向量编码为 表或码本中的对应向量条目的索引。另外或替代地,量化器B 224可经配置以发送一或 多个参数,向量可在解码器处从所述一或多个参数动态地加以产生,而非如在稀疏码本 方法中从存储装置检索。此类方法用于例如代数CELP(码激发线性预测)的译码方案和 例如3GPP2(第三代合作伙伴2)EVRC(增强型可变速率编解码器)的编解码器中。在一 些配置中,经编码激发信号226和滤波参数228可包含于经编码语音信号106中。

编码器204根据对应解码器208将可获得的相同滤波器参数值来产生经编码激发信 号226可为有益的。以此方式,所得经编码激发信号226可在一定程度上解决那些参数 值中的非理想性,例如,量化错误。因此,使用将在解码器208处可用的相同系数值来 配置分析滤波器222可为有益的。在如图2中所说明的编码器204的基本实例中,反量 化器A 218对滤波参数228进行解量化。反系数变换A 220将所得值映射回到一组对应 系数。此组系数用以配置分析滤波器222以产生通过量化器B 224量化的残余信号。

编码器204的一些实施方案经配置以通过识别在一组码本向量当中最佳地匹配残余 信号的一个码本向量来计算经编码激发信号226。然而,应注意,编码器204也可经实 施以计算残余信号的经量化表示而不实际上产生所述残余信号。例如,编码器204可经 配置以使用数个码本向量产生对应合成信号(例如,根据一组当前滤波参数)且选择与最 佳地匹配感知加权域中的原始语音信号202的所产生信号相关联的码本向量。

解码器208可包含反量化器B 230、反量化器C 236、反系数变换B 238和合成滤波 器234。反量化器C 236对滤波参数228(例如,LSF向量)进行解量化,且反系数变换B  238将LSF向量变换成一组系数(例如,如上文参考编码器204的反量化器A 218和反系 数变换A 220所描述)。反量化器B 230对经编码激发信号226进行解量化以产生激发信 号232。基于所述系数和激发信号232,合成滤波器234合成经解码语音信号210。换句 话说,合成滤波器234经配置以根据经解量化的系数在光谱上对激发信号232进行塑形 以产生经解码语音信号210。在一些配置中,解码器208也可将激发信号232提供到另 一解码器,所述另一解码器可使用激发信号232来导出另一频带(例如,高频带)的激发 信号。在一些实施方案中,解码器208可经配置以将关于激发信号232的额外信息(例如 频谱倾斜、音调增益和滞后以及语音模式)提供到另一解码器。

编码器204和解码器208的系统为合成式分析语音编解码器的基本实例。码本激发 线性预测译码为合成式分析译码的一个流行家族。此类译码器的实施方案可执行残余的 波形编码,包含例如从固定和自适应性码本选择输入项、错误最小化操作和/或感知加权 操作的操作。合成式分析译码的其它实施方案包含混合激发线性预测(MELP)、代数CELP (ACELP)、松弛CELP(RCELP)规则脉冲激发(RPE)、多脉冲激发(MPE)、多脉冲CELP (MP-CELP),和向量总和激发线性预测(VSELP)译码。相关译码方法包含多频带激发 (MBE)和原型波形内插(PWI)译码。标准化合成式分析语音编解码器的实例包含ETSI(欧 洲电信标准协会)-GSM全速率编解码器(GSM 06.10)(其使用残余激发线性预测(RELP))、 GSM增强型全速率编解码器(ETSI-GSM 06.60)、ITU(国际电信联盟)标准11.8千位/秒 (kbps)G.729Annex E译码器、用于IS-136(时分多址方案)的IS(临时标准)-641编解码 器、GSM自适应性多速率(GSM-AMR)编解码器和4GVTM(第四代VocoderTM)编解码器 (QUALCOMM公司,加利福尼亚州圣地牙哥)。可根据这些技术中的任一者或将语音信 号表示为(A)描述滤波器的一组参数和(B)用以驱动所述滤波器以重现所述语音信号的激 发信号的任何其它语音译码技术(不管已知或是待开发)来实施编码器204和对应解码器 208。

甚至在分析滤波器222已从语音信号202去除粗糙的频谱包封之后,大量精细谐波 结构仍可保留,对于有声语音尤其如此。周期性结构与音调有关,且由相同说话者说出 的不同有声声音可具有不同共振峰结构但具有类似的音调结构。

可通过使用一或多个参数值对音调结构的特性进行编码来提高译码效率和/或语音 质量。音调结构的一个重要特性为第一谐波的频率(也称为基本频率),其通常在60赫兹 (Hz)到400Hz的范围内。此特性通常编码为基本频率的倒数,也称为音调滞后。音调滞 后指示一个音调周期中的样本的数目,且可编码为一或多个码本索引。来自男性说话者 的语音信号倾向于比来自女性说话者的语音信号具有更大音调滞后。

与音调结构相关的另一信号特性为周期性,其指示谐波结构的强度,或换句话说, 信号为谐波或非谐波的程度。周期性的两个典型指示项为零交叉和正规化从相关函数 (NACF)。也可通过音调增益来指示周期性,音调增益通常编码为码本增益(例如,经量 化自适应性码本增益)。

编码器204可包含经配置以对语音信号202的长期谐波结构进行编码的一或多个模 块。在CELP编码的一些方法中,编码器204包含开环线性预测性译码(LPC)分析模块, 其对短期特性或粗糙的频谱包封进行编码,随后为闭环长期预测分析阶段,其对精细音 调或谐波结构进行编码。短期特性被编码为系数(例如,滤波参数228),且长期特性被 编码为例如音调滞后和音调增益的参数的值。例如,编码器204可经配置而以包含一或 多个码本索引(例如,固定码本索引和自适应性码本索引)和对应增益值的形式输出经编 码激发信号226。残余信号的此经量化表示的计算(例如,通过量化器B 224)可包含选择 这些索引和计算这些值。音调结构的编码也可包含音调原型波形的内插,其操作可包含 计算连续音调脉冲之间的差。对于对应于无声语音的帧(其通常为噪声样且非结构化的), 可停用长期结构的模型化。

解码器208的一些实施方案可经配置以在已恢复长期结构(音调或谐波结构)之后将 激发信号232输出到另一解码器(例如,高频带解码器)。例如,此类解码器可经配置以 输出激发信号232,作为经编码激发信号226的经解量化的版本。当然,也有可能实施 解码器208使得另一解码器执行经编码激发信号226的反量化以获得激发信号232。

图3为说明宽带语音编码器342和宽带语音解码器358的实例的框图。宽带语音编 码器342和/或宽带语音解码器358的一或多个组件可以硬件(例如,电路)、软件或两者 的组合加以实施。宽带语音编码器342与宽带语音解码器358可实施于单独电子装置上 或同一电子装置上。

宽带语音编码器342包含滤波器组A 344、第一频带编码器348和第二频带编码器 350。滤波器组A 344经配置以对宽带语音信号340进行滤波以产生第一频带信号346a(例 如,窄频信号)和第二频带信号346b(例如,高频信号)。

第一频带编码器348经配置以对第一频带信号346a进行编码以产生滤波参数352 (例如,窄频(NB)滤波参数)和经编码激发信号354(例如,经编码窄频激发信号)。在一 些配置中,第一频带编码器348可作为码本索引或以另一经量化形式产生滤波器参数352 和经编码激发信号354。在一些配置中,第一频带编码器348可根据结合图2描述的编 码器204加以实施。

第二频带编码器经350配置以根据经编码激发信号354中的信息对第二频带信号 346b(例如,高频信号)进行编码以产生第二频带译码参数356(例如,高频译码参数)。 第二频带编码器350可经配置以作为码本索引或以另一经量化形式产生第二频带译码参 数356。宽带语音编码器342的一个特定实例经配置而以约8.55kbps的速率对宽带语音 信号340进行编码,其中约7.55kbps用于滤波器参数352和经编码激发信号354,且约 1kbps用于第二频带译码参数356。在一些实施中,滤波器参数352、经编码激发信号 354和第二频带译码参数356可包含于经编码语音信号106中。

在一些配置中,第二频带编码器350可类似于结合图2描述的编码器204而加以实 施。例如,第二频带编码器350可产生第二频带滤波器参数(例如,作为第二频带译码参 数356的部分),如结合编码器204(结合图2加以描述)所描述。然而,第二频带编码器 350可在一些方面中不同。例如,第二频带编码器350可包含第二频带激发产生器,所 述第二频带激发产生器可基于经编码激发信号354产生第二频带激发信号。第二频带编 码器350可利用所述第二频带激发信号产生合成的第二频带信号且确定第二频带增益因 数。在一些配置中,第二频带编码器350可量化所述第二频带增益因数。因此,第二频 带译码参数356的实例包含第二频带滤波器参数和经量化第二频带增益因数。

将滤波器参数352、经编码激发信号354和第二频带译码参数356组合于单一位流 中可为有益的。例如,对经编码信号一起进行多工以供传输(例如,经由有线、光学或无 线传输信道)或存储(为经编码宽带语音信号)可为有益的。在一些配置中,宽带语音编码 器342包含经配置以将滤波器参数352、经编码激发信号354和第二频带译码参数356 组合成一经多工信号的多路复用器。滤波器参数352、经编码激发信号354和第二频带 译码参数356可为包含于如结合图1所描述的经编码语音信号106中的参数的实例。

在一些实施方案中,包含宽带语音编码器342的电子装置也可包含经配置以在例如 有线、光学或无线信道的传输信道中传输经多工信号的电路。此类电子装置也可经配置 以对信号执行一或多个信道编码操作,例如错误校正编码(例如,速率兼容性卷积编码) 和/或错误检测编码(例如,循环冗余编码),和/或网络协议编码的一或多个层(例如,以 太网、传输控制协议/因特网协议(TCP/IP)、cdma2000等)。

以下情况可为有益的:多路复用器经配置以作为经多工信号的可分离子流嵌入滤波 器参数352与经编码激发信号354,使得可独立于所述经多工信号的另一部分(例如,高 频和/或低频信号)而对滤波器参数352和经编码激发信号354进行复原和解码。例如, 经多工信号可经布置而使得可通过去除第二频带译码参数356而复原滤波器参数352和 经编码激发信号354。此类特征的一个潜在益处为避免了在将第二频带译码参数356传 递到支持对滤波器参数352和经编码激发信号354的解码但不支持对第二频带译码参数 356的解码的系统之前对第二频带译码参数356进行转码的需要。

宽带语音解码器358可包含第一频带解码器360、第二频带解码器366和滤波器组 B 368。第一频带解码器360(例如,窄频解码器)经配置以对滤波器参数352和经编码激 发信号354进行解码以产生经解码第一频带信号362a(例如,经解码窄频信号)。第二频 带解码器366经配置以根据激发信号364(例如,窄频激发信号)、基于经编码激发信号 354对第二频带译码参数356进行解码,以产生经解码第二频带信号362b(例如,经解 码高频信号)。在此实例中,第一频带解码器360经配置以将激发信号364提供到第二频 带解码器366。滤波器组368经配置以组合经解码第一频带信号362a和经解码第二频带 信号362b以产生经解码宽带语音信号370。

宽带语音解码器358的一些实施方案可包含多路分用器(未图示),所述多路分用器 经配置以从经多工信号产生滤波器参数352、经编码激发信号354和第二频带译码参数 356。包含宽带语音解码器358的电子装置可包含经配置以从例如有线、光学或无线信 道的传输信道接收经多工信号的电路。此类电子装置也可经配置以对信号执行一或多个 信道解码操作,例如错误校正解码(例如,速率兼容性卷积解码)和/或错误检测解码(例如, 循环冗余解码),和/或网络协议解码的一或多个层(例如,以太网、TCP/IP、cdma2000)。

宽带语音编码器342中的滤波器组A 344经配置以根据分裂频带方案对输入信号进 行滤波以产生第一频带信号346a(例如,窄频或低频率子频带信号)和第二频带信号346b (例如,高频或高频率子频带信号)。取决于特定应用的设计准则,输出子频带可具有相 等或不相等的频宽,且可重叠或不重叠。滤波器组A 344的产生两个以上子频带的配置 也为可能的。例如,滤波器组A 344可经配置以产生一或多个低频信号,所述一或多个 低频信号包含频率范围低于第一频带信号346a的频率范围(例如50赫兹(Hz)到300Hz 的范围)的分量。也有可能滤波器组A 344经配置以产生一或多个额外高频信号,所述一 或多个额外高频信号包含频率范围高于第二频带信号346b的频率范围(例如14千赫兹 (kHz)到20kHz、16kHz到20kHz或16kHz到32kHz的范围)的分量。在此类配置中, 宽带语音编码器342可经实施以单独地对信号进行编码,且多路复用器可经配置以在经 多工信号中包含额外经编码信号(例如,作为一或多个可分离的部分)。

图4为说明编码器404的更特定实例的框图。明确地说,图4说明用于低位速率语 音编码的CELP合成式分析架构。在此实例中,编码器404包含成帧和预处理模块472、 分析模块476、系数变换478、量化器480、合成滤波器484、求和器488、感知加权滤 波和错误最小化模块492以及激发估计模块494。应注意,编码器404和/或编码器404 的组件(例如,模块)中的一或多者可以硬件(例如,电路)、软件或两者的组合加以实施。

语音信号402(例如,输入语音s)可为含有语音信息的电子信号。例如,可通过麦克 风捕获声波语音信号且对其进行采样以产生语音信号402。在一些配置中,语音信号402 可以16kHz进行采样。语音信号402可包括如上文结合图1所描述的频率范围。

语音信号402可提供到成帧和预处理模块472。成帧和预处理模块472可将语音信 号402划分成一系列帧。每一帧可为一特定时段。例如,每一帧可对应于语音信号402 的20ms。成帧和预处理模块472可对语音信号执行其它操作,例如滤波(例如,低通、 高通和带通滤波中的一或多者)。因此,成帧和预处理模块472可基于语音信号402产生 经预处理的语音信号474(例如,S(l),其中l为样本编号)。

分析模块476可确定一组系数(例如,线性预测分析滤波器A(z))。例如,分析模块 476可将经预处理的语音信号474的频谱包络编码为如结合图2所描述的一组系数。

所述系数可提供到系数变换478。系数变换478将所述组系数变换成如上文结合图 2所描述的对应LSF向量(例如,LSF、LSP、ISF、ISP等)。

LSF向量提供到量化器480。量化器480将LSF向量量化成经量化LSF向量482。 例如,量化器480可对LSF向量执行向量量化以产生经量化LSF向量482。在一些配置 中,可在子帧基础上产生和/或量化LSF向量。在这些配置中,仅对应于某些子帧(例如, 每一帧的最后或末端子帧)的经量化LSF向量可发送到语音解码器。在这些配置中,量 化器480也可确定经量化加权向量441。加权向量可用以量化对应于所发送的子帧的LSF 向量之间的LSF向量(例如,中间LSF向量)。加权向量可经量化。例如,量化器480可 确定对应于最佳地匹配实际加权向量的加权向量的码本或查找表的索引。经量化加权向 量441(例如,索引)可发送到语音解码器。经量化加权向量441和经量化LSF向量482 可为上文结合图2所述的滤波器参数228的实例。

量化器480可产生指示每一帧的预测模式的预测模式指示符481。预测模式指示符 481可发送到解码器。在一些配置中,预测模式指示符481可指示用于帧的两个预测模 式中的一者(例如,利用预测性量化或是非预测性量化)。例如,预测模式指示符481可 指示帧是基于先前帧(例如,预测性)或是不基于先前帧(例如,非预测性)加以量化。预测 模式指示符481可指示当前帧的预测模式。在一些配置中,预测模式指示符481可为发 送到解码器的指示帧系通过预测性量化或是非预测性量化加以量化的位。

经量化LSF向量482提供到合成滤波器484。合成滤波器484基于LSF向量482(例 如,经量化系数)和激发信号496产生合成语音信号486(例如,重构建的语音s其中 l为样本编号)。例如,合成滤波器484基于经量化LSF向量482(例如,1/A(z))对激发信 号496进行滤波。

通过求和器488从经预处理的语音信号474减去合成语音信号486以产生错误信号 490(也被称作预测错误信号)。错误信号490提供到感知加权滤波和错误最小化模块492。

感知加权滤波和错误最小化模块492基于错误信号490产生经加权错误信号493。 例如,并非错误信号490的所有分量(例如,频率分量)均同等地影响合成语音信号的感 知质量。一些频带中的错误比其它频带中的错误对语音质量具有更大影响。感知加权滤 波和错误最小化模块492可产生经加权错误信号493,经加权错误信号493减小对语音 质量具有较大影响的频率分量中的错误,且将更多错误分配于对语音质量具有较少影响 的其它频率分量中。

激发估计模块494基于感知加权滤波和错误最小化模块492的输出产生激发信号 496和经编码激发信号498。例如,激发估计模块494估计表征错误信号490(例如,经 加权错误信号493)的一或多个参数。经编码激发信号498可包含所述一或多个参数且可 发送到解码器。例如,在CELP方法中,激发估计模块494可确定表征错误信号490(例 如,经加权错误信号493)的参数,例如自适应性(或音调)码本索引、自适应性(或音调) 码本增益、固定码本索引和固定码本增益。基于这些参数,激发估计模块494可产生激 发信号496,激发信号496提供到合成滤波器484。在此方法中,自适应性码本索引、 自适应性码本增益(例如,经量化自适应性码本增益)、固定码本索引和固定码本增益(例 如,经量化固定码本增益)可发送到解码器作为经编码激发信号498。

经编码激发信号498可为上文结合图2所描述的经编码激发信号226的实例。因此, 经量化加权向量441、经量化LSF向量482、经编码激发信号498和/或预测模式指示符 481可包含于如上文结合图1所描述的经编码语音信号106中。

图5为说明随时间501推移的帧503的实例的图。每一帧503划分成数个子帧505。 在图5中所说明的实例中,先前帧A 503a包含4个子帧505a到505d,先前帧B 503b 包含4个子帧505e到505h,且当前帧C 503c包含4个子帧505i到505l。典型帧503 可占据20ms的时段,且可包含4个子帧,但可使用不同长度的帧和/或不同数目的子帧。 每一帧可用对应帧编号来表示,其中n表示当前帧(例如,当前帧C 503c)。此外,每一 子帧可用对应子帧编号k来表示。

图5可用以说明编码器中的LSF量化的一个实例。帧n中的每一子帧k具有对应的 LSF向量供用于分析和合成滤波器中。当前帧末端LSF向量527(例如, 第n个帧的最后子帧LSF向量)表示为其中当前帧中间LSF向量525(例 如,第n个帧的中间LSF向量)表示为“中间LSF向量”为时间501中的其它LSF 向量之间(例如与之间)的LSF向量。先前帧末端LSF向量523的一个实例说明 于图5中且表示为其中如本文所使用,术语“先前帧”可指当前帧 之前的任何帧(例如,n-1、n-2、n-3等)。因此,“先前帧末端LSF向量”可为对应于当 前帧之前的任何帧的末端LSF向量。在图5中所说明的实例中,先前帧末端LSF向量 523对应于紧接在当前帧C 503c(例如,帧n)之前的先前帧B 503b(例如,帧n-1)的最后 子帧505h。

每一LSF向量为M维的,其中LSF向量的每一维度对应于单一LSF维度或值。例 如,M对于宽带语音(例如,以16kHz采样的语音)通常为16。帧n的第k子帧的第i LSF 维度表示为其中i={1,2,...,M}。

在帧n的量化过程中,可首先量化末端LSF向量此量化可为非预测性的(例如, 先前LSF向量不用于量化过程中)或预测性的(例如,先前LSF向量用于量化 过程中)。可接着量化中间LSF向量例如,编码器可选择加权向量使得如方程 式(1)中所提供。

xi,nm=wi,n·xi,ne+(1-wi,n)·xi,n-1e---(1)

加权向量wn的第i维度对应于单一权重,且由wi,n表示,其中i={1,2,...,M}。也应 注意,wi,n不受约束。明确地说,如果0≤wi,n≤1产生由和定界的值,且wi,n<0 或wi,n>1,所得中间LSF向量可在范围xi,nexi,n-1e之外。编码器可确定(例如,选 择)加权向量wn而使得经量化中间LSF向量基于一些失真测量(例如均方误差(MSE)或对 数频谱失真(LSD))最接近于编码器中的实际中间LSF向量。在量化过程中,编码器传输 末端LSF向量的量化索引和加权向量wn的索引,其使得解码器能够重构建和

使用如由方程式(2)给出的内插因数αk和βk基于和内插子帧LSF向 量

xnk=αk·xne+·βk·xn-1e+(1-αk-βk)·xnm---(2)

应注意,αk和βk使得0≤(αkk)≤1。内插因数αk和βk可为编码器和解码器两者 均已知的预定值。

图6为说明用于通过编码器404对语音信号进行编码的方法600的一个配置的流程 图。例如,包含编码器404的电子装置可执行方法600。图6说明用于当前帧n的LSF 量化程序。

编码器404可获得先前帧经量化末端LSF向量(602)。例如,编码器404可通过选 择最接近于对应于先前帧n-1的末端LSF向量的码本向量而量化对应于先前帧(例如, )的末端LSF向量。

编码器404可量化当前帧末端LSF向量(例如,)(604)。编码器404在使用预测 性LSF量化的情况下基于先前帧末端LSF向量量化当前帧末端LSF向量(604)。然而, 量化当前帧LSF向量(604)在非预测性量化用于当前帧末端LSF向量的情况下并不基于 先前帧末端LSF向量。

编码器404可通过确定加权向量(例如,wn)量化当前帧中间LSF向量(例如,) (606)。例如,编码器404可选择导致最接近于实际中间LSF向量的经量化中间LSF向 量的加权向量。如方程式(1)中所说明,经量化中间LSF向量可基于加权向量、先前帧 末端LSF向量和当前帧末端LSF向量。

编码器404可将经量化当前帧末端LSF向量和加权向量发送到解码器(608)。例如, 编码器404可将当前帧末端LSF向量和加权向量提供到电子装置上的传输器,所述传输 器可将所述当前帧末端LSF向量和所述加权向量传输到另一电子装置上的解码器。

图7为说明LSF向量确定的实例的图。图7说明随时间701推移的先前帧A 703a(例 如,帧n-1)和当前帧B 703b(例如,帧n)。在此实例中,语音样本使用加权滤波器进行 加权且接着用于LSF向量确定(例如,计算)。首先,编码器404处的加权滤波器用以确 定先前帧末端LSF向量(例如,)(707)。其次,编码器404处的加权滤波器用以确 定当前帧末端LSF向量(例如,)(709)。再次,编码器404处的加权滤波器用以确定(例 如,计算)当前帧中间LSF向量(例如,)(711)。

图8包含说明LSF内插和外插的实例的两个图。实例A 821a中的横轴说明频率(Hz) 819a,且实例B 821b中的横轴也说明频率(Hz)819b。明确地说,图8中在频域中表示 若干LSF维度。然而,应注意,存在表示LSF维度的多个方式(例如,频率、角度、值 等)。因此,可用其它单位描述实例A 821a和实例B 821a中的横轴819a到819b。

实例A 821a说明考虑LSF向量的第一维度的内插情况。如上文所描述,LSF维度 指单一LSF维度或LSF向量的值。具体地说,实例A 821a说明500Hz下的先前帧末端 LSF维度813a(例如,)和800Hz下的当前帧末端LSF维度(例如,)817a。在 实例A 821a中,第一权重(例如,加权向量wn或w1,n的第一维度)可用以量化和指示频率 819a中的先前帧末端LSF维度(例如,)813a与当前帧末端LSF维度(例如,) 817a之间的当前帧中间LSF向量的中间LSF维度(例如,)815a。例如,如果w1,n=0.5、 x1,ne=800x1,n-1e=500,那么x1,nm=w1,n·x1,ne+(1-w1,n)·x1,n-1e=650,如实例A 821a中 所说明。

实例B 821b说明考虑LSF向量的第一LSF维度的外插情况。具体地说,实例B 821b 说明500Hz下的先前帧末端LSF维度(例如,)813b和800Hz下的当前帧末端LSF 维度(例如,)817b。在实例B 821b中,第一权重(例如,加权向量wn或w1,n的第一 维度)可用以量化和指示不处于频率819b中的先前帧末端LSF维度(例如,)813b 与当前帧末端LSF维度(例如,)817b之间的当前帧中间LSF向量的中间LSF维度(例 如,)815b。例如,如实例B 821b中所说明,如果w1,n=2、且那么x1,nm=[2*x1,ne]+[(1-2)*x1,n-1e]2·800+(-1)·500=1100.

图9为说明用于通过解码器对经编码语音信号进行解码的方法900的一个配置的流 程图。例如,包含解码器的电子装置可执行方法900。

解码器可获得先前帧经解量化的末端LSF向量(例如,)(902)。例如,解码器 可检索对应于先前已解码(或估计,在帧抹除的情况下)的先前帧的经解量化的末端LSF 向量。

编码器可解量化当前帧末端LSF向量(例如,)(904)。例如,解码器可通过基于 所接收的LSF向量索引查找码本或表中的当前帧LSF向量来解量化当前帧末端LSF向 量(904)。

解码器可基于加权向量(例如,wn)确定当前帧中间LSF向量(例如,)(906)。例 如,解码器可从编码器接收加权向量。解码器可接着如方程式(1)中所说明基于先前帧末 端LSF向量、当前帧末端LSF向量和加权向量确定当前帧中间LSF向量(906)。如上文 所描述,每一LSF向量可具有M个维度或LSF维度(例如,16个LSF维度)。LSF向量 中的LSF维度中的两者或两者以上之间应存在最小分离以便使LSF向量稳定。然而, 如果存在仅以最小分离群集的多个LSF维度,那么存在不稳定LSF向量的实质可能性。 如上文所描述,解码器可在LSF向量中的LSF维度中的两者或两者以上之间的分离小 于最小值的情况下对LSF向量进行重排序。

结合图4到9描述的用于加权和内插和/或外插LSF向量的方法在清洁信道条件(无 帧抹除和/或传输错误)下操作良好。然而,在一或多个帧抹除出现时,此方法可具有一 些严重问题。被抹除帧为未由解码器接收到或被不正确地错误接收的帧。例如,如果对 应于一帧的经编码语音信号未被接收到或被不正确地错误接收,那么所述帧为被抹除帧。

下文参考图5给出帧抹除的实例。假定先前帧B 503b为被抹除帧(例如,帧n-1丢 失)。在此情况下,解码器基于先前帧A 503a(例如,帧n-2)估计丢失的末端LSF向量(表 示为)和中间LSF向量(表示为)。也假定帧n正确地接收。解码器可使用方程式 (1)基于和计算当前帧中间LSF向量525。在外插的特定LSF维度j(例如, 维度j)的情况中,存在以下可能性:LSF维度远处于用于编码器中的外插过程(例如, )中的LSF维度频率外部。

每一LSF向量中的LSF维度可经排序而使得其中Δ为 两个连续LSF维度之间的最小分离(例如,频率分离)。如上文所描述,如果某些LSF维 度j(例如,表示为)经错误地外插而使得其显著大于正确值,那么后续LSF维度 可重新计算为即使其在解码器中计算为 例如,尽管重新计算的LSF维度j、j+1等可能小于LSF维度j, 但其可归因于所外加的排序结构而重新计算为此产生具有两个或 两个以上LSF维度的LSF向量,其位置彼此邻近而具有最小所允许距离。通过仅最小 分离分开的两个或两个以上LSF维度可称为“群集LSF维度”。群集LSF维度可导致不 稳定的LSF维度(例如,不稳定的子帧LSF维度)和/或不稳定的LSF向量。不稳定的LSF 维度对应于可导致语音伪声的合成滤波器的系数。

在严格意义上,如果滤波器在单位圆上或单位圆外部的至少一个极点,那么滤波器 可为不稳定的。在语音译码的情况下且如本文所使用,术语“不稳定”和“不稳定性” 按较宽意义使用。例如,“不稳定LSF维度”为对应于可导致语音伪声的合成滤波器的 系数的任何LSF维度。例如,不稳定的LSF维度可未必对应于在单位圆上或单位圆外 部的极点,但在其值彼此过于接近的情况下可为“不稳定的”。这是因为位置彼此过于 接近的LSF维度可指定在产生语音伪声的一些频率中具有高度谐振的滤波器响应的合 成滤波器中的极点。例如,不稳定的经量化LSF维度可指定可导致不合需要的能量增加 的合成滤波器的极点放置。通常,对于根据在0与π之间的角度表示的LSF维度,LSF 维度分离可维持在0.01*π周围。如本文所使用,“不稳定的LSF向量”为包含一或多个 不稳定LSF维度的向量。此外,“不稳定的合成滤波器”为具有对应于一或多个不稳定 的LSF维度的一或多个系数(例如,极点)的合成滤波器。

图10为说明群集LSF维度1029的一个实例的图。以频率(Hz)1019说明LSF维度, 但应注意,可替代地以其它单位表征LSF维度。LSF维度(例如,1031a、1031b 和1031c)为在估计和重排序之后包含于当前帧中间LSF向量中的LSF维度的实例。 例如,在先前被抹除帧中,解码器估计可能不正确的先前帧末端LSF向量(例如,) 的第一LSF维度。在此情况下,当前帧中间LSF向量(例如,1031a)的第一LSF维 度也可能不正确。

解码器可试图重排序当前帧中间LSF向量(例如,1031b)的下一LSF维度。如 上文所描述,可能需要LSF向量中的每一相连LSF维度大于先前元素。例如,1031b 必须大于1031a。因此,解码器可将其放置为与1031a具有最小分离(例如,Δ)。 更具体地说,因此,可存在具有最小分离(例如,Δ=100Hz)的多个LSF 维度(例如,1031a、1031b和1031c),如图10中所说明。因此,1031a、 1031b和1031c为群集LSF维度1029的实例。群集LSF维度可导致不稳定的 合成滤波器,所述合成滤波器又可在合成语音中产生语音伪声。

图11为说明归因于群集LSF维度的伪声1135的实例的曲线图。更具体地说,所述 曲线图说明经解码语音信号(例如,合成语音)中的起因于应用于合成滤波器的群集LSF 维度的伪声1135的实例。所述曲线图的横轴系按时间1101(例如,秒)加以说明,且所 述曲线图的纵轴系按振幅1133(例如,编号、值)加以说明。振幅1133可为以位数表示 的数目。在一些配置中,可利用16个位来表示值范围在-32768到32767之间的语音信 号的样本,其对应于一个范围(例如,浮点中的-1与+1之间的值)。应注意,可基于实施 方案而以不同方式表示振幅1133。在一些实例中,振幅1133的值可对应于通过电压(以 伏特计)和/或电流(以安培计)表征的电磁信号。

在子帧基础上在当前帧LSF向量与先前帧LSF向量之间内插和/或外插LSF向量在 语音译码系统中是已知的。在如结合图10和11所描述的被抹除帧条件下,LSF内插和 /或外插方案可对于某些子帧产生不稳定的LSF向量,此可在合成的语音中导致恼人的 伪声。当对于LSF量化除非预测性技术以外也使用预测性量化技术时,伪声出现地更频 繁。

使用增加数目个位以防错和使用非预测性量化以避免错误传播为解决所述问题的 常见方式。然而,在位受约束译码器下额外位的引入是不可能的,且使用非预测性量化 可降低清洁信道条件(例如,无被抹除帧)中的语音质量。

本文中所揭示的系统和方法可用于减低潜在的帧不稳定性。例如,本文中所揭示的 系统和方法的一些配置可应用于减低归因于帧不稳定性(由受损的信道下的LSF向量的 预测性量化和帧帧间内插和外插而产生)的语音译码伪声。

图12为说明经配置以用于减低潜在的帧不稳定性的电子装置1237的一个配置的框 图。电子装置1237包含解码器1208。可根据结合图12描述的解码器1208而实施上文 所述的解码器中的一或多者。电子装置1237也包含被抹除帧检测器1243。被抹除帧检 测器1243可与解码器1208单独地实施或可实施于解码器1208中。被抹除帧检测器1243 检测被抹除帧(例如,未被接收到或错误地接收的帧),且可在检测到被抹除帧时提供被 抹除帧指示符1267。例如,被抹除帧检测器1243可基于杂凑函数、校验和、重复码、 校验位、循环冗余检查(CRC)等中的一或多者来检测被抹除帧。应注意,包含于电子装 置1237和/或解码器1208中的组件中的一或多者可以硬件(例如,电路)、软件或两者的 组合加以实施。本文中的框图中所说明的线或箭头中的一或多者可指示组件或元件之间 的耦合(例如,连接)。

解码器1208基于所接收的参数产生经解码语音信号1259(例如,合成语音信号)。 所接收的参数的实例包含经量化LSF向量1282、经量化加权向量1241、预测模式指示 符1281和经编码激发信号1298。解码器1208包含反量化器A 1245、内插模块1249、 反系数变换1253、合成滤波器1257、帧参数确定模块1261、加权值替代模块1265、稳 定性确定模块1269和反量化器B 1273中的一或多者。

解码器1208接收经量化LSF向量1282(例如,经量化LSF、LSP、ISF、ISP、PARCOR 系数、反射系数或对数面积比率值)和经量化加权向量1241。所接收的经量化LSF向量 1282可对应于子帧的子集。例如,经量化LSF向量1282可仅包含对应于每一帧的最后 子帧的经量化末端LSF向量。在一些配置中,经量化LSF向量1282可为对应于查找表 或码本的索引。另外或替代地,经量化加权向量1241可为对应于查找表或码本的索引。

电子装置1237和/或解码器1208可从编码器接收预测模式指示符1281。如上文所 描述,预测模式指示符1281指示每一帧的预测模式。例如,预测模式指示符1281可指 示一帧的两个或两个以上预测模式中的一者。更具体地说,预测模式指示符1281可指 示利用预测性量化或是非预测性量化。

当正确地接收到帧时,反量化器A 1245解量化所接收的经量化LSF向量1282以产 生经解量化的LSF向量1247。例如,反量化器A 1245可基于对应于查找表或码本的索 引(例如,经量化LSF向量1282)而查找经解量化的LSF向量1247。解量化经量化LSF 向量1282也可基于预测模式指示符1281。经解量化的LSF向量1247可对应于子帧的 子集(例如,对应于每一帧的最后子帧的末端LSF向量)。此外,反量化器A 1245解 量化经量化加权向量1241以产生经解量化的加权向量1239。例如,反量化器A 1245可 基于对应于查找表或码本的索引(例如,经量化加权向量1241)而查找经解量化的加权向 量1239。

当帧为被抹除帧时,被抹除帧检测器1243可将被抹除帧指示符1267提供到反量化 器A 1245。当出现被抹除帧时,一或多个经量化LSF向量1282和/或一或多个经量化加 权向量1241可能不被接收或可能含有错误。在此情况下,反量化器A 1245可基于来自 先前帧(例如,在被抹除帧之前的帧)的一或多个LSF向量来估计一或多个经解量化的 LSF向量1247(例如,被抹除帧的末端LSF向量)。另外或替代地,反量化器A 1245 可在出现被抹除帧时估计一或多个经解量化的加权向量1239。

经解量化的LSF向量1247(例如,末端LSF向量)可提供到帧参数确定模块1261和 内插模块1249。此外,一或多个经解量化的加权向量1239可提供到帧参数确定模块1261。 帧参数确定模块1261获得帧。例如,帧参数确定模块1261可获得被抹除帧(例如,对应 于被抹除帧的估计的经解量化的加权向量1239和估计的经解量化的LSF向量1247)。帧 参数确定模块1261也可获得被抹除帧之后的帧(例如,正确地接收的帧)。例如,帧参数 确定模块1261可获得对应于被抹除帧之后的正确接收的帧的经解量化的加权向量1239 和经解量化的LSF向量1247。

帧参数确定模块1261基于经解量化的LSF向量1247和经解量化的加权向量1239 确定帧参数A 1263a。帧参数A 1263a的一个实例为中间LSF向量(例如,)。例如, 帧参数确定模块可应用所接收的加权向量(例如,经解量化的加权向量1239)以产生当前 帧中间LSF向量。例如,帧参数确定模块1261可基于当前帧末端LSF向量先前帧 末端LSF向量和当前帧加权向量wn根据方程式(1)确定当前帧中间LSF向量帧参数A 1263a的其它实例包含LSP向量和ISP向量。例如,帧参数A 1263a可为基于 两个末端子帧参数估计的任何参数。

在一些配置中,帧参数确定模块1261可确定帧参数(例如,当前帧中间LSF向量) 在任何重排序之前是否是根据规则进行排序。在一个实例中,此帧参数为当前帧中间LSF 向量且所述规则可为中间LSF向量中的每一LSF维度呈增序且在每一LSF维 度对之间具有至少最小分离。在此实例中,帧参数确定模块1261可确定中间LSF向量中的每一LSF维度是否呈增序且在每一LSF维度对之间具有至少最小分离。例如,帧 参数确定模块1261可确定是否为真。

在一些配置中,帧参数确定模块1261可将排序指示符1262提供到稳定性确定模块 1269。排序指示符1262指示LSF维度(例如,中间LSF向量中的LSF维度)是否无序 和/或分离在任何重排序之前不大于最小分离Δ。

在一些情况下,帧参数确定模块1261可对LSF向量进行重排序。例如,如果帧参 数确定模块1261确定包含于当前帧中间LSF向量中的LSF维度不呈增序和/或这些 LSF维度不具有每一LSF维度对之间的至少最小分离,那么帧参数确定模块1261可对 LSF维度进行重排序。例如,帧参数确定模块1261可对当前帧中间LSF向量中的 LSF维度进行重排序,使得对于不满足准则的每一LSF维度, 换句话说,帧参数确定模块1261可将Δ加到LSF维度以获得下一LSF 维度的位置(如果下一LSF维度未至少分离Δ)。此外,仅可对于未分离最小分离Δ的LSF 维度完成此操作。如上文所描述,此重排序可导致中间LSF向量中的群集LSF维度。 因此,在一些情况下(例如,对于被抹除帧之后的一或多个帧),帧参数A 1263a可为经 重排序的LSF向量(例如,中间LSF向量)。

在一些配置中,帧参数确定模块1261可实施为反量化器A 1245的部分。例如,基 于经解量化的LSF向量1247和经解量化的加权向量1239确定中间LSF向量可认为是 解量化程序的部分。帧参数A 1263a可提供到加权值替代模块1265且任选地提供到稳定 性确定模块1269。

稳定性确定模块1269可确定帧是否潜在地不稳定。当稳定性确定模块1269确定当 前帧潜在地不稳定时,稳定性确定模块1269可将不稳定性指示符1271提供到加权值替 代模块1265。换句话说,不稳定性指示符1271指示当前帧潜在地不稳定。

潜在不稳定的帧为具有指示产生语音伪声的风险的一或多个特性的帧。指示产生语 音伪声的风险的特性的实例可包含帧在被抹除帧之后的一或多个帧内、所述帧与被抹除 帧之间的任何帧是否利用预测性(或非预测性)量化和/或帧参数在任何重排序之前是否 是根据规则进行排序。潜在地不稳定的帧可对应于(例如,可包含)一或多个不稳定LSF 向量。应注意,在一些情况下,潜在地不稳定的帧可实际上稳定。然而,可能难以在不 合成整个帧的情况下确定所述帧是必然稳定或是必然不稳定。因此,本文中所揭示的系 统和方法可采取校正动作以减低潜在地不稳定的帧。本文中所揭示的系统和方法的一个 益处为在不合成整个帧的情况下检测潜在地不稳定的帧。此可减小检测和/或减低语音伪 声所需的处理和/或延迟量。

在第一方法中,稳定性确定模块1269基于当前帧是否在被抹除帧之后的阈值数目 个帧内和被抹除帧与当前帧之间的任何帧是否利用预测性(或非预测性)量化而确定当前 帧(例如,帧n)是否潜在地不稳定。当前帧可被正确地接收。在此方法中,稳定性确定 模块1269在当前帧是于被抹除帧之后的阈值数目个帧内接收的情况下和当前帧与被抹 除帧(如果存在)之间无帧利用非预测性量化的情况下确定帧潜在地不稳定。

可基于被抹除帧指示符1267确定被抹除帧与当前帧之间的帧数目。例如,稳定性 确定模块1269可维护计数器,所述计数器对于在被抹除帧之后的每一帧递增。在一个 配置中,在被抹除帧之后的帧的阈值数目可为1。在此配置中,始终认为在被抹除帧之 后的下一帧潜在地不稳定。例如,如果当前帧为被抹除帧之后的下一帧(因此,在当前帧 与被抹除帧之间无帧利用非预测性量化),那么稳定性确定模块1269确定当前帧潜在地 不稳定。在此情况下,稳定性确定模块1269提供指示当前帧潜在地不稳定的不稳定性 指示符1271。

在其它配置中,在被抹除帧之后的帧的阈值数目可大于1。在这些配置中,稳定性 确定模块1269可基于预测模式指示符1281确定当前帧与被抹除帧之间是否存在利用非 预测性量化的帧。例如,预测模式指示符1281可指示预测性或非预测性量化是否用于 每一帧。如果当前帧与被抹除帧之间存在使用非预测性量化的帧,那么稳定性确定模块 1269可确定当前帧系稳定的(例如,并不潜在地不稳定)。在此情况下,稳定性确定模块 1269可不指示当前帧潜在地不稳定。

在第二方法中,稳定性确定模块1269基于当前帧是否是在被抹除帧之后接收、帧 参数A 1263a在任何重排序之前是否是根据规则进行排序和被抹除帧与当前帧之间的任 何帧是否利用非预测性量化来确定当前帧(例如,帧n)是否潜在地不稳定。在此方法中, 稳定性确定模块1269在当前帧是在被抹除帧之后获得的情况下、在帧参数A 1263a在任 何重排序之前并非根据规则进行排序的情况下和当前帧与被抹除帧(如果存在)之间无帧 利用非预测性量化的情况下确定帧潜在地不稳定。

可基于被抹除帧指示符1267确定当前帧是否是在被抹除帧之后接收。可基于如上 文所描述的预测模式指示符确定被抹除帧与当前帧之间的任何帧是否利用非预测性量 化。例如,如果当前帧为被抹除帧之后的任何数目个帧、如果当前帧与被抹除帧之间无 帧利用非预测性量化且如果帧参数A 1263a在任何重排序之前并非根据规则进行排序, 那么稳定性确定模块1269确定当前帧潜在地不稳定。在此情况下,稳定性确定模块1269 提供指示当前帧潜在地不稳定的不稳定性指示符1271。

在一些配置中,稳定性确定模块1269可从帧参数确定模块1261获得排序指示符 1262,其指示帧参数A 1263a(例如,当前帧中间LSF向量)在任何重排序之前是否是 根据规则进行排序。例如,排序指示符1262可指示LSF维度(例如,中间LSF向量的 LSF维度)在任何重排序之前是否系无序的和/或未分离开至少最小分离Δ。

在一些配置中,可实施第一方法与第二方法的组合。例如,第一方法可应用于在被 抹除帧之后的第一帧,而第二方法可应用于后续帧。在此配置中,后续帧中的一或多者 可基于第二方法而指示为潜在地不稳定。确定潜在不稳定性的其它方法可基于合成滤波 器的脉冲响应的能量变化、基于对应于合成滤波器的不同频带的LSF向量和/或能量变 化、基于LSF向量。

在未指示潜在不稳定性时(例如,在当前帧稳定时),加权值替代模块1265将帧参数 A 1263a作为帧参数B 1263提供或传递到内插模块1249。在一个实例中,帧参数A 1263a 为当前帧中间LSF向量其是基于当前帧末端LSF向量先前帧末端LSF向量和所接收的当前帧加权向量wn。在未指示潜在不稳定性时,可假定当前帧中间LSF向 量稳定,且可将其提供到内插模块1249。

如果当前帧潜在地不稳定,那么加权值替代模块1265应用替代加权值以产生稳定 帧参数(例如,替代当前帧中间LSF向量)。“稳定帧参数”为将不引起语音伪声的参 数。替代加权值可为确保稳定帧参数(例如,帧参数B 1263b)的预定值。可代替(所接收 的和/或估计的)经解量化的加权向量1239而应用替代加权值。更具体地说,当不稳定性 指示符1271指示当前帧潜在地不稳定时,加权值替代模块1265将替代加权值应用于经 解量化的LSF向量1247以产生稳定帧参数B 1263b。在此情况下,可舍弃帧参数A 1263a 和/或当前帧经解量化的加权向量1239。因此,当当前帧潜在地不稳定时,加权值替代 模块1265产生替代帧参数A 1263a的帧参数B 1263b。

例如,加权值替代模块1265可应用替代加权值wsubstitute以产生(稳定)替代当前帧中 间LSF向量例如,加权值替代模块1265可将替代加权值应用于当前帧末端LSF 向量和先前帧末端LSF向量。在一些配置中,替代加权值wsubstitute可为0与1之间的纯 量值。例如,替代加权值wsubstitute可作为替代加权向量(例如,具有M个维度)而操作, 其中所有值等于wsubstitute,其中0≤wsubstitute≤1(或0<wsubstitute<1)。因此,可根据方 程式(3)产生或确定(稳定)替代当前帧中间LSF向量

xnm=wsubstitute·xne+(1-wsubstitute)·xn-1e---(3)

利用0与1之间的wsubstitute确保在基础末端LSF向量和稳定的情况下,所 得替代当前帧中间LSF向量稳定。在此情况下,替代当前帧中间LSF向量为稳定帧 参数的一个实例,这是因为将对应于替代当前帧中间LSF向量的系数1255应用于合成 滤波器1257将不会在经解码语音信号1259中引起语音伪声。在一些配置中,wsubstitute 可选择为0.6,其较的于对应于被抹除帧的先前帧末端LSF向量(例如,)向当前帧 末端LSF向量(例如,)给出稍大的权重。

在替代配置中,替代加权值可为包含个别权重的替代加权向量wsubstitute, 其中i={1,2,...,M},且n指示当前帧。在这些配置中,每一权重在0与1之间, 且所有权重可不相同。在这些配置中,可如方程式(4)中所提供而应用替代加权值(例如, 替代加权向量wsubstitute)。

xi,nm=wi,nsubstitute·xi,ne+(1-wi,nsubstitute)·xi,n-1e---(4)

在一些配置中,替代加权值可为静态的。在其它配置中,加权值替代模块1265可 基于先前帧和当前帧选择替代加权值。例如,可基于两个帧(例如,先前帧和当前帧)的 分类(例如,有声、无声等)而选择不同替代加权值。另外或替代地,可基于两个帧之间 的一或多个LSF差异(例如,LSF滤波器脉冲响应能量中的差异)而选择不同替代加权值。

经解量化的LSF向量1247和帧参数B 1263b可提供到内插模块1249。内插模块1249 内插经解量化的LSF向量1247和帧参数B 1263b以便产生子帧LSF向量(例如,用于当 前帧的子帧LSF向量)。

在一个实例中,帧参数B 1263为当前帧中间LSF向量且经解量化的LSF向量 1247包含先前帧末端LSF向量和当前帧末端LSF向量例如,内插模块1249 可基于和使用内插因数αk和βk根据方程式 xnk=αk·xne+·βk·xn-1e+(1-αk-βk)·xnm内插子帧LSF向量内插因数αk和βk可为 预定值,使得0≤(αkk)≤1。此处,k为整数子帧编号,其中1≤k≤K-1,其中K为当 前帧中的子帧的总数。内插模块1249相应地内插对应于当前帧中的每一子帧的LSF向 量。在一些配置中,对于当前帧末端LSF向量αk=1且βk=0。

内插模块1249将LSF向量1251提供到反系数变换1253。反系数变换1253将LSF 向量1251变换成系数1255(例如,用于合成滤波器的滤波器系数1/A(z))。系数1255提 供到合成滤波器1257。

反量化器B 1273接收经编码激发信号1298并对其进行解量化以产生激发信号1275。 在一个实例中,经编码激发信号1298可包含固定码本索引、经量化固定码本增益、自 适应性码本索引和经量化自适应性码本增益。在此实例中,反量化器B 1273基于固定 码本索引查找固定码本输入项(例如,向量),且将经解量化的固定码本增益应用到固定 码本输入项以获得固定码本贡献。此外,反量化器B 1273基于自适应性码本索引查找 自适应性码本输入项,且将经解量化的自适应性码本增益应用于自适应性码本输入项以 获得自适应性码本贡献。反量化器B 1273可接着对固定码本贡献和自适应性码本贡献 进行求和以产生激发信号1275。

合成滤波器1257根据系数1255对激发信号1275进行滤波以产生经解码语音信号 1259。例如,可根据系数1255配置合成滤波器1257的极点。激发信号1275接着传递 经过合成滤波器1257以产生经解码语音信号1259(例如,合成语音信号)。

图13为说明用于减低潜在的帧不稳定性的方法1300的一个配置的流程图。电子装 置1237可获得在被抹除帧之后(例如,在时间上在被抹除帧之后)的帧(1302)。例如,电 子装置1237可基于杂凑函数、校验和、重复码、校验位、循环冗余检查(CRC)等中的一 或多者来检测被抹除帧。电子装置1237可接着获得被抹除帧之后的帧(1302)。所获得 (1302)的帧可为被抹除帧之后的下一帧或可为被抹除帧之后的任何数目个帧。所获得 (1302)的帧可为正确接收的帧。

电子装置1237可确定所述帧是否潜在地不稳定(1304)。在一些配置中,确定所述帧 是否潜在地不稳定(1304)是基于帧参数(例如,当前帧中间LSF向量)在任何重排序之前 (例如,在重排序(如果存在)之前)是否是根据规则进行排序。另外或替代地,确定所述帧 是否潜在地不稳定(1304)可基于帧(例如,当前帧)是否在从被抹除帧起的阈值数目个帧内。 另外或替代地,确定所述帧是否潜在地不稳定(1304)可基于所述帧(例如,当前帧)与被抹 除帧之间的任何帧是否利用非预测性量化。

在如上文所描述的第一方法中,电子装置1237在帧是于被抹除帧之后的阈值数目 个帧内接收的情况下和所述帧与被抹除帧(如果存在)之间无帧利用非预测性量化的情况 下确定所述帧潜在地不稳定(1304)。在如上文所描述的第二方法中,电子装置1237在当 前帧是在被抹除帧之后获得的情况下、在帧参数(例如,当前帧中间LSF向量)在任何 重排序之前并非根据规则进行排序的情况下和在当前帧与被抹除帧(如果存在)之间无帧 利用非预测性量化的情况下确定帧潜在地不稳定(1304)。可使用额外或替代方法。例如, 第一方法可应用于被抹除帧之后的第一帧,而第二方法可应用于后续帧。

电子装置1237可在所述帧潜在地不稳定的情况下应用替代加权值以产生稳定帧参 数(1306)。例如,电子装置1237可通过将替代加权值应用于经解量化的LSF向量1247(例 如,应用于当前帧末端LSF向量和先前帧末端LSF向量)而产生稳定帧参数(例 如,替代当前帧中间LSF向量)。例如,产生所述稳定帧参数可包含确定替代当前帧 中间LSF向量(例如,),所述替代当前帧中间LSF向量等于当前帧末端LSF向量(例 如,)与所述替代加权值(例如,wsubstitute)的乘积加上先前帧末端LSF向量(例如,) 与1减所述替代加权值(例如,(1-wsubstitute))的差的乘积。可例如如方程式(3)或方程式 (4)中所说明而实现此操作。

图14为说明用于减低潜在的帧不稳定性的方法1400的更特定配置的流程图;电子 装置1237可获得当前帧(1402)。例如,电子装置1237可获得用于对应于当前帧的时段 的参数。

电子装置1237可确定当前帧是否为被抹除帧(1404)。例如,电子装置1237可基于 杂凑函数、校验和、重复码、校验位、循环冗余检查(CRC)等中的一或多者来检测被抹 除帧。

如果当前帧为被抹除帧,那么电子装置1237可基于先前帧获得估计的当前帧末端 LSF向量和估计的当前帧中间LSF向量(1406)。例如,解码器1208可对被抹除帧使用错 误隐藏。在错误隐藏中,解码器1208可分别将先前帧末端LSF向量和先前帧中间LSF 向量复制为估计的当前帧LSF向量和估计的当前帧中间LSF向量。可对于相连被抹除 帧遵循此程序。

例如,在两个相连被抹除帧的情况下,第二被抹除帧可包含来自第一被抹除帧的末 端LSF向量的复本和所有内插的LSF向量,例如中间LSF向量和子帧LSF向量。因此, 第二被抹除帧中的LSF向量可与第一被抹除帧中的LSF向量大致相同。例如,可从先 前帧复制第一被抹除帧末端LSF向量。因此,可从最后正确接收的帧导出相连被抹除帧 中的所有LSF向量。最后正确接收的帧可具有极高概率为稳定的。因此,相连被抹除帧 具有不稳定LSF向量的概率极小。此本质上是因为在相连被抹除帧的情况下,在两个相 异的LSF向量之间可能不存在内插。因此,在一些配置中,可不对连续抹除的帧应用替 代加权值。

电子装置1237可确定当前帧的子帧LSF向量(1416)。例如,电子装置1237可基于 内插因数内插当前帧末端LSF向量、当前帧中间LSF向量和先前帧末端LSF向量来产 生当前帧的子帧LSF向量。在一些配置中,可根据方程式(2)实现此操作。

电子装置1237可合成当前帧的经解码语音信号1259(1418)。例如,电子装置1237 可基于子帧LSF向量1251而使激发信号1275传递经过由系数1255指定的合成滤波器 1257以产生经解码语音信号1259。

如果当前帧不为被抹除帧,那么电子装置1237可应用所接收的加权向量来产生当 前帧中间LSF向量(1408)。例如,电子装置1237可用所接收的加权向量乘以当前帧末 端LSF向量且可用1减所接收的加权向量乘以先前帧末端LSF向量。电子装置1237可 接着对所得乘积求和以产生当前帧中间LSF向量。可如方程式(1)中所提供而实现此操 作。

电子装置1237可确定当前帧是否在从最后被抹除帧起的阈值数目个帧内(1410)。例 如,电子装置1237可利用对从指示被抹除帧的被抹除帧指示符1267起的每一帧进行计 数的计数器。所述计数器可在每次出现被抹除帧时复位。电子装置1237可确定所述计 数器是否在阈值数目个帧内。阈值数目可为一或多个帧。如果当前帧不在从最后被抹除 帧起的阈值数目个帧内,那么电子装置1237可如上文所描述而确定当前帧的子帧LSF 向量(1416)且合成经解码语音信号1259(1418)。确定当前帧是否在从最后被抹除帧起的 阈值数目个帧内(1410)可减少对帧的不必要处理,同时具有低不稳定性概率(例如,对于 在一或多个潜在地不稳定的帧之后出现的帧(已减低其潜在不稳定性))。

如果当前帧在从最后被抹除帧起的阈值数目个帧内,那么电子装置1237可确定当 前帧与最后被抹除帧之间的任何帧是否利用非预测性量化(1412)。例如,电子装置1237 可接收指示每一帧利用预测性量化或是非预测性量化的预测模式指示符1281。电子装置 1237可利用预测模式指示符1281来追踪每一帧的预测模式。如果当前帧与最后被抹除 帧之间的任何帧利用非预测性量化,那么电子装置1237可如上文所描述而确定当前帧 的子帧LSF向量(1416)且合成经解码语音信号1259(1418)。确定当前帧与最后被抹除帧 之间的任何帧是否利用非预测性量化(1412)可减少对帧的不必要处理,同时具有低不稳 定性概率(例如,对于在应包含准确末端LSF向量的帧之后出现的帧,这是因为末端LSF 向量并非基于任何先前帧加以量化)。

如果当前帧与最后被抹除帧之间无帧利用非预测性量化(例如,如果当前帧与最后被 抹除帧之间的所有帧利用预测性量化),那么电子装置1237可应用替代加权值以产生替 代当前帧中间LSF向量(1414)。在此情况下,电子装置1237可确定当前帧潜在地不稳 定,且可应用替代加权值以产生稳定帧参数(例如,替代当前帧中间LSF向量)。例如, 电子装置1237可用替代加权向量乘以当前帧末端LSF向量且可用1减所述替代加权向 量乘以先前帧末端LSF向量。电子装置1237可接着对所得乘积求和以产生替代当前帧 中间LSF向量。可如方程式(3)或方程式(4)中所提供而实现此操作。

电子装置1237可接着如上文所描述而确定当前帧的子帧LSF向量(1416)。例如, 电子装置1237可基于当前帧末端LSF向量、先前帧末端LSF向量、替代当前帧中间LSF 向量和内插因数来内插子帧LSF向量。可根据方程式(2)实现此操作。电子装置1237也 可如上文所描述而合成经解码语音信号1259(1418)。例如,电子装置1237可基于子帧 LSF向量1251(其基于替代当前中间LSF向量)使激发信号1275传递经过由系数1255 指定的合成滤波器1257以产生经解码语音信号1259。

图15为说明用于减低潜在的帧不稳定性的方法1500的另一更特定配置的流程图。 电子装置1237可获得当前帧(1502)。例如,电子装置1237可获得用于对应于当前帧的 时段的参数。

电子装置1237可确定当前帧是否为被抹除帧(1504)。例如,电子装置1237可基于 杂凑函数、校验和、重复码、校验位、循环冗余检查(CRC)等中的一或多者来检测被抹 除帧。

如果当前帧为被抹除帧,那么电子装置1237可基于先前帧获得估计的当前帧末端 LSF向量和估计的当前帧中间LSF向量(1506)。可如上文结合图14所描述而实现此操作。

电子装置1237可确定当前帧的子帧LSF向量(1516)。可如上文结合图14所描述而 实现此操作。电子装置1237可合成当前帧的经解码语音信号1259(1518)。可如上文结 合图14所描述而实现此操作。

如果当前帧不为被抹除帧,那么电子装置1237可应用所接收的加权向量来产生当 前帧中间LSF向量(1508)。可如上文结合图14所描述而实现此操作。

电子装置1237可确定当前帧与最后被抹除帧之间的任何帧是否利用非预测性量化 (1510)。可如上文结合图14所描述而实现此操作。如果当前帧与最后被抹除帧之间的任 何帧利用非预测性量化,那么电子装置1237可如上文所描述而确定当前帧的子帧LSF 向量(1516)且合成经解码语音信号1259(1518)。

如果当前帧与最后被抹除帧之间无帧利用非预测性量化(例如,如果当前帧与最后被 抹除帧之间的所有帧利用预测性量化),那么电子装置1237可确定当前帧中间LSF向量 在任何重排序之前是否是根据规则进行排序(1512)。例如,电子装置1237可确定中间 LSF向量中的每一LSF在任何重排序之前是否呈增序且在每一LSF维度对之间具有 至少最小分离,如上文结合图12所描述。如果当前帧中间LSF向量在任何重排序之前 是根据规则进行排序,那么电子装置1237可如上文所描述而确定当前帧的子帧LSF向 量(1516)且合成经解码语音信号1259(1518)。

如果当前帧中间LSF向量在任何重排序之前并非根据规则进行排序,那么电子装置 1237可应用替代加权值以产生替代当前帧中间LSF向量(1514)。在此情况下,电子装置 1237可确定当前帧潜在地不稳定,且可应用替代加权值以产生稳定帧参数(例如,替代 当前帧中间LSF向量)。可如上文结合图14所描述而实现此操作。

电子装置1237可接着确定当前帧的子帧LSF向量(1516)且合成经解码语音信号 1259(1518),如上文结合图14所描述。例如,电子装置1237可基于子帧LSF向量1251 (其是基于替代当前中间LSF向量)使激发信号1275传递经过由系数1255指定的合成滤 波器1257以产生经解码语音信号1259。

图16为说明用于减低潜在的帧不稳定性的方法1600的另一更特定配置的流程图。 例如,可在两个程序中应用本文中所揭示的系统和方法的一些配置:检测潜在LSF不稳 定性和减低所述潜在LSF不稳定性。

电子装置1237可接收在被抹除帧之后的帧(1602)。例如,电子装置1237可检测被 抹除帧且接收在所述被抹除帧之后的一或多个帧。更具体地说,电子装置1237可接收 对应于被抹除帧之后的帧的参数。

电子装置1237可确定是否存在当前帧中间LSF向量不稳定的可能性。在一些实施 方案中,电子装置1237可假定被抹除帧之后的一或多个帧潜在地不稳定(例如,其包含 潜在地不稳定的中间LSF向量)。

如果检测到潜在不稳定性,那么可舍弃由编码器用于内插/外插(例如,作为索引传 输到解码器1208)的所接收加权向量wn。例如,电子装置1237(例如,解码器1208)可 舍弃加权向量。

电子装置1237可应用替代加权值以产生(稳定)替代当前帧中间LSF向量(1604)。例 如,解码器1208应用替代加权值wsubstitute,如上文结合图12所描述。

如果后续帧(例如,n+1、n+2等)使用预测性量化技术来量化末端LSF向量,那么 LSF向量的不稳定性可传播。因此,对于当前帧和在电子装置1237确定(1606、1614) 将非预测性LSF量化技术用于帧之前所接收(1608)的后续帧,解码器1208可确定当前 帧中间LSF向量在任何重排序之前是否根据规则进行排序(1612)。更具体地说,电子装 置1237可确定当前帧是否利用预测性LSF量化(1606)。如果当前帧利用预测性LSF量 化,那么电子装置1237可确定是否正确地接收到新帧(例如,下一帧)(1608)。如果新帧 被不正确地接收(例如,新帧为被抹除帧),那么操作可继续进行到接收被抹除帧之后的 当前帧(1602)。如果电子装置1237确定正确地接收到新帧(1608),那么电子装置1237 可应用所接收的加权向量来产生当前帧中间LSF向量(1610)。例如,电子装置1237可 使用当前加权向量用于当前帧中间LSF(一开始不替换其)。因此,对于在使用非预测性 LSF量化技术之前的所有(正确接收的)后续帧,解码器可应用所接收的加权向量来产生 当前帧中间LSF向量(1610)且确定当前帧中间LSF向量在任何重排序之前是否根据规则 进行排序(1612)。例如,电子装置1237可基于从编码器传输的索引应用加权向量用于中 间LSF向量内插(1610)。接着,电子装置1237可确定1612对应于所述帧的当前帧中间 LSF向量在任何重排序之前是否经排序而使得

如果检测到规则的违反,那么中间LSF向量潜在地不稳定。例如,如果电子装置 1237确定对应于所述帧的中间LSF向量在任何重排序之前并未根据规则进行排序(1612), 那么电子装置1237因此确定所述中间LSF向量中的LSF维度潜在地不稳定。解码器1208 可通过如上文所描述应用替代加权值(1604)而减低潜在不稳定性。

如果当前帧中间LSF向量是根据规则进行排序,那么电子装置1237可确定当前帧 是否利用预测性量化(1614)。如果当前帧利用预测性量化,那么电子装置1237可应用替 代加权值(1604),如上文所描述。如果电子装置1237确定当前帧不利用预测性量化(例 如,当前帧利用非预测性量化)(1614),那么电子装置1237可确定是否正确地接收到新 帧(1616)。如果新帧被不正确地接收(例如,如果新帧为被抹除帧),那么操作可继续进行 到接收被抹除帧之后的当前帧(1602)。

如果当前帧利用非预测性量化且如果电子装置1237确定正确地接收到新帧(1616), 那么解码器1208继续使用用于规则操作模式中的所接收加权向量正常操作。换句话说, 电子装置1237可基于从编码器传输的索引应用所接收加权向量用于每一正确接收的帧 的中间LSF向量内插(1618)。明确地说,电子装置1237可基于从编码器接收的索引应 用所接收加权向量用于每一后续帧(例如,n+nnp+1、n+nnp+2、等,其中nnp为利用非预 测性量化的帧编号)(1618),直到出现被抹除帧。

本文中所揭示的系统和方法可实施于解码器1208中。在一些配置中,不需要将额 外位从编码器传输到解码器1208以实现对潜在的帧不稳定性的检测和减低。此外,本 文中所揭示的系统和方法在清洁信道条件中不使质量降级。

图17为说明合成语音信号的实例的曲线图。所述曲线图的横轴是按时间1701(例如, 秒)加以说明,且所述曲线图的纵轴系按振幅1733(例如,编号、值)加以说明。振幅1733 可为用位数表示的数目。在一些配置中,可利用16个位来表示值范围在-32768到32767 之间的语音信号的样本,其对应于一个范围(例如,浮点中的-1与+1之间的值)。应注意, 可基于实施方案而以不同方式表示振幅1733。在一些实例中,振幅1733的值可对应于 通过电压(以伏特计)和/或电流(以安培计)表征的电磁信号。

本文中所揭示的系统和方法可经实施以产生如在图17中给出的合成语音信号。换 句话说,图17为说明从应用本文中所揭示的系统和方法而产生的合成语音信号的一个 实例的曲线图。不应用本文中所揭示的系统和方法的对应波形展示于图11中。如可观 测到,本文中所揭示的系统和方法提供伪声减低1777。换句话说,通过应用本文中所揭 示的系统和方法,图11中所说明的伪声1135得以减低或去除,如图17中所说明。

图18为说明无线通信装置1837的一个配置的框图,在所述无线通信装置1837中 可实施用于减低潜在的帧不稳定性的系统和方法。图18中所说明的无线通信装置1837 可为本文中所描述的电子装置中的至少一者的实例。无线通信装置1837可包含应用处 理器1893。应用处理器1893通常处理指令(例如,运行程序)以执行无线通信装置1837 上的功能。应用处理器1893可耦合到音频译码器/解码器(编解码器)1891。

音频编解码器1891可用于对音频信号进行译码和/或解码。音频编解码器1891可耦 合到至少一个扬声器1883、听筒1885、输出插口1887和/或至少一个麦克风1889。扬 声器1883可包含将电或电子信号转换成声波信号的一或多个电声转换器。例如,扬声 器1883可用以播放音乐或输出扬声器电话交谈等。听筒1885可为可用以将声波信号(例 如,语音信号)输出到用户的另一扬声器或电声转换器。例如,可使用听筒1885而使得 仅一个用户可可靠地听到声学信号。输出插口1887可用于将例如头戴式耳机的其它装 置耦合到无线通信装置1837以用于输出音频。扬声器1883、听筒1885和/或输出插口 1887可通常用于从音频编解码器1891输出音频信号。至少一个麦克风1889可为将声学 信号(例如用户的话音)转换成提供到音频编解码器1891的电或电子信号的声电转换器。

音频编解码器1891(例如,解码器)可包含帧参数确定模块1861、稳定性确定模块 1869和/或加权值替代模块1865。帧参数确定模块1861、稳定性确定模块1869和/或加 权值替代模块1865可如上文结合图12所描述而行使功能。

应用处理器1893也可耦合到电力管理电路1804。电力管理电路1804的一个实例为 电力管理集成电路(PMIC),其可用以管理无线通信装置1837的电力消耗。电力管理电 路1804可耦合到电池组1806。电池组1806可通常将电力提供到无线通信装置1837。 例如,电池组1806和/或电力管理电路1804可耦合到包含于无线通信装置1837中的元 件中的至少一者。

应用处理器1893可耦合到用于接收输入的至少一个输入装置1808。输入装置1808 的实例包含红外线传感器、图像传感器、加速度计、触摸传感器、小键盘等。输入装置 1808可允许用户与无线通信装置1837交互。应用处理器1893也可耦合到一或多个输出 装置1810。输出装置1810的实例包含打印机、投影仪、屏幕、触觉装置等。输出装置 1810可允许无线通信装置1837产生可由用户体验的输出。

应用处理器1893可耦合到应用存储器1812。应用存储器1812可为能够存储电子信 息的任何电子装置。应用存储器1812的实例包含双数据速率同步动态随机存取存储器 (DDRAM)、同步动态随机存取存储器(SDRAM)、快闪存储器等。应用存储器1812可为 应用处理器1893提供存储。例如,应用存储器1812可存储用于使在应用处理器1893 上运行的程序行使功能的数据和/或指令。

应用处理器1893可耦合到显示控制器1814,显示控制器1814又可耦合到显示器 1816。显示控制器1814可为用以在显示器1816上产生图像的硬件块。例如,显示控制 器1814可将来自应用处理器1893的指令和/或数据转译成可呈现在显示器1816上的图 像。显示器1816的实例包含液晶显示器(LCD)面板、发光二极管(LED)面板、阴极射线 管(CRT)显示器、等离子显示器等。

应用处理器1893可耦合到基带处理器1895。基带处理器1895通常处理通信信号。 例如,基带处理器1895可对所接收的信号进行解调制和/或解码。另外或替代地,基带 处理器1895可对信号进行编码和/或调制以准备传输。

基带处理器1895可耦合到基带存储器1818。基带存储器1818可为能够存储电子信 息的任何电子装置,例如SDRAM、DDRAM、快闪存储器等。基带处理器1895可从基 带存储器1818读取信息(例如,指令和/或数据)和/或将信息写入到基带存储器1818。另 外或替代地,基带处理器1895可使用存储于基带存储器1818中的指令和/或数据来执行 通信操作。

基带处理器1895可耦合到射频(RF)收发器1897。RF收发器1897可耦合到功率放 大器1899和一或多个天线1802。RF收发器1897可发射和/或接收射频信号。例如,RF 收发器1897可使用功率放大器1899和至少一个天线1802发射RF信号。RF收发器1897 也可使用所述一或多个天线1802接收RF信号。应注意,包含于无线通信装置1837中 的元件中的一或多者可耦合到可实现元件之间的通信的通用总线。

图19说明可用于电子装置1937中的各种组件。所说明组件可位于同一物理结构内 或位于单独外壳或结构中。可根据本文中所描述的装置中的一或多者实施结合图19描 述的电子装置1937。电子装置1937包含处理器1926。处理器1926可为通用单芯片或 多芯片微处理器(例如,ARM)、专用微处理器(例如,数字信号处理器(DSP))、微控制器、 可编程门阵列等。处理器1926可被称为中央处理单元(CPU)。尽管图19的电子装置1937 中仅展示单一处理器1926,但在替代配置中,可使用处理器的组合(例如,ARM和DSP)。

电子装置1937也包含与处理器1926电子通信的存储器1920。即,处理器1926可 从存储器1920读取信息和/或将信息写入到存储器1920。存储器1920可为能够存储电 子信息的任何电子组件。存储器1920可为随机存取存储器(RAM)、只读存储器(ROM)、 磁盘存储媒体、光学存储媒体、RAM中的快闪存储器装置、与处理器包含在一起的机 载存储器、可编程只读存储器(PROM)、可抹除可编程只读存储器(EPROM)、电可抹除 PROM(EEPROM)、寄存器等,包含其组合。

数据1924a和指令1922a可存储在存储器1920中。所述指令1922a可包含一或多个 程序(program)、例程、子例程、函数、程序(procedure)等。所述指令1922a可包含单一 计算机可读语句或许多计算机可读语句。所述指令1922a可由处理器1926执行以实施 上文所述的方法、功能和程序中的一或多者。执行所述指令1922a可涉及使用存储在存 储器1920中的数据1924a。图19展示载入于处理器1926中的一些指令1922b和数据 1924b(其可来自指令1922a和数据1924a)。

电子装置1937也可包含用于与其它电子装置通信的一或多个通信接口1930。通信 接口1930可基于有线通信技术、无线通信技术或两者。不同类型的通信接口1930的实 例包含串列端口、平行端口、通用串列总线(USB)、以太网配接器、IEEE 1394总线接口、 小计算机系统接口(SCSI)总线接口、红外线(IR)通信端口、蓝牙无线通信配接器等。

电子装置1937也可包含一或多个输入装置1932和一或多个输出装置1936。不同种 类的输入装置1932的实例包含键盘、鼠标、麦克风、遥控装置、按钮、操纵杆、轨迹 球、触控板、光笔等。例如,电子装置1937可包含用于捕获声波信号的一或多个麦克 风1934。在一个配置中,麦克风1934可为将声波信号(例如,话音、语音)转换成电或 电子信号的转换器。不同种类的输出装置1936的实例包含扬声器、打印机等。例如, 电子装置1937可包含一或多个扬声器1938。在一个配置中,扬声器1938可为将电或电 子信号转换成声波信号的转换器。可通常包含于电子装置1937中的一个特定类型的输 出装置为显示装置1940。配合本文中所揭示的配置使用的显示装置1940可利用任何适 当的图像投影技术,例如阴极射线管(CRT)、液晶显示器(LCD)、发光二极管(LED)、气 体等离子、电致发光或其类似者。显示控制器1942也可经提供而用于将存储于存储器 1920中的数据转换成在显示装置1940上展示的文字、图形和/或移动图像(在适当的情况 下)。

电子装置1937的各种组件可由一或多个总线耦合在一起,其可包含电力总线、控 制信号总线、状态信号总线、数据总线等。为简单起见,各种总线在图19中说明为总 线系统1928。应注意,图19仅说明电子装置1937的一个可能配置。可利用各种其它架 构和组件。

在以上描述中,参考数字有时已与各种术语结合使用。在术语与参考数字结合使用 的情况下,此可希望指代展示于诸图中的一或多者中的特定元件。在无参考数字而使用 术语的情况下,此可希望泛指所述术语而不限于任何特定图。

术语“确定”涵盖多种动作,且因此“确定”可包括计算(calculating、computing)、 处理、推导、研究、查找(例如,在表、数据库或另一数据结构中查找)、确定和其类似 者。又,“确定”可包含接收(例如,接收信息)、访问(例如,访问存储器中的数据)和其 类似者。又,“确定”可包含解析、选择、挑选、建立和其类似者。

片语“基于”并不意味着“仅基于”,除非另有明确指定。换句话说,片语“基于” 描述“仅基于”和“至少基于”两者。

应注意,在兼容的情况下,结合本文中所描述的配置中的任一者描述的特征、功能、 程序、组件、元件、结构等中的一或多者可与结合本文中所描述的其它配置中的任一者 描述的功能、程序、组件、元件、结构等中的一或多者加以组合。换句话说,可根据本 文中所揭示的系统和方法实施本文中所描述的功能、程序、组件、元件等的任何兼容组 合。

可将本文中所描述的功能作为一或多个指令存储于处理器可读或计算机可读媒体 上。术语“计算机可读媒体”指可由计算机或处理器存取的任何可用媒体。作为实例而 非限制,此类媒体可包括RAM、ROM、EEPROM、快闪存储器、CD-ROM或其它光盘 存储装置、磁盘存储装置或其它磁性存储装置或可用以存储呈指令或数据结构的形式的 所要程序代码且可由计算机存取的任何其它媒体。如本文所使用,磁盘和光盘包含紧密 光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软碟和光盘,其中 磁盘通常以磁性方式重现数据,而光盘通过激光以光学方式重现数据。应注意,计算机 可读媒体可为有形的和非暂时性的。术语“计算机程序产品”指计算装置或处理器,其 与可由所述计算装置或处理器执行、处理或计算的代码或指令(例如,“程序”)相组合。 如本文所使用,术语“代码”可指可由计算装置或处理器执行的软件、指令、代码或数 据。

软件或指令也可经由传输媒体加以传输。例如,如果使用同轴电缆、光缆、双绞线、 数字用户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程 源传输软件,那么同轴电缆、光缆、双绞线、DSL或例如红外线、无线电和微波的无线 技术包含于传输媒体的定义中。

本文中所揭示的方法包括用于达成所描述方法的一或多个步骤或动作。所述方法步 骤和/或动作可彼此互换而不脱离权利要求书的范围。换句话说,除非对于所描述方法的 恰当操作需要步骤或动作的特定次序,否则可修改特定步骤和/或动作的次序和/或使用 而不脱离权利要求书的范围。

应理解,权利要求书不限于上文所说明的精确配置和组件。可在本文中所描述的系 统、方法和设备的布置、操作和细节中进行各种修改、改变和变化而不脱离权利要求书 的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号