首页> 中国专利> 在音频信号的不连续传输中具有高频谱时间分辨率的舒缓噪声的生成

在音频信号的不连续传输中具有高频谱时间分辨率的舒缓噪声的生成

摘要

本发明提出一种被配置用于解码位串流以从其中产生一音频输出信号的音频解码器,该位串流包含接着至少一个不活动阶段的至少一个活动阶段,其中该位串流已经于其中编码描述背景噪声的频谱的至少一个静默插入描述符帧,该音频解码器包含:静默插入描述符解码器,被配置为解码该静默插入描述符帧以重建该背景噪声的该频谱;解码装置,被配置为在该活动阶段期间从该位串流重建该音频输出信号;频谱转换器,被配置为确定该音频输出信号的频谱;噪声估计器装置,被配置为根据由该频谱转换器所提供的该音频输出信号之该频谱而确定该音频输出信号之该噪声的第一频谱,其中该音频输出信号之该噪声的该第一频谱具有比该背景噪声的该频谱更高的频谱分辨率;分辨率转换器,被配置为根据该音频输出信号之该噪声的该第一频谱而建立该音频输出信号之该噪声的第二频谱,其中该音频输出信号之该噪声的该第二频谱具有与该背景噪声的该频谱相同的频谱分辨率;舒缓噪声频谱估计装置,具有定标因子计算装置,被配置为根据如由该静默插入描述符解码器所提供的该背景噪声的该频谱,及根据如由该分辨率转换器所提供的该音频输出信号之该噪声的该第二频谱,针对舒缓噪声的频谱计算定标因子,及具有舒缓噪声频谱生成器,被配置为根据该定标因子计算针对舒缓噪声的该频谱;及舒缓噪声生成器,被配置为根据针对该舒缓噪声的该频谱在该不活动阶段期间产生该舒缓噪声。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-24

    授权

    授权

  • 2016-01-06

    著录事项变更 IPC(主分类):G10L19/012 变更前: 变更后: 申请日:20131219

    著录事项变更

  • 2015-09-23

    实质审查的生效 IPC(主分类):G10L19/012 申请日:20131219

    实质审查的生效

  • 2015-08-26

    公开

    公开

说明书

技术领域

本发明涉及音频信号处理,并且更具体地,涉及添加舒缓噪声至音频 信号。

背景技术

舒缓噪声生成器通常用于音频信号的不连续传输(DTX)中,特别含语 音的音频信号。于此种模式中,该音频信号首先由语音活动检测器(VAD) 分类为活动帧及不活动帧。根据该VAD结果,只有该活动语音帧被编码 及以标称比特率传输。于长期暂停期间,于该处只存在有背景噪声,比特 率降低或归零,及该背景噪声使用静默插入描述符帧(SID帧)偶发地且参 数地编码。然后,平均比特率显著降低。

该噪声在该不活动帧期间于该解码器端由舒缓噪声生成器(CNG)生 成。实际上SID帧的大小极有限。因此,描述该背景噪声之参数数目须保 持尽可能地小。为了达成此项目的,噪声估计不直接地施加于该频谱变换 的输出。反而是通过求频带群组中的该输入功率频谱的平均,例如遵照巴 克(Bark)尺标而以较低频谱分辨率施用。求平均可通过算术或几何手段达 成。不幸地,于该等SID帧中传输的有限参数数目不允许捕捉该背景噪声 的精密频谱结构。因此只有噪声的平滑频谱包络可通过CNG再生。当该 VAD触发CNG帧时,该重建舒缓噪声之平滑频谱与该实际背景噪声之频 谱间的不一致变成在活动帧(涉及该信号的吵杂语音部分的常规编码及解 码)与CNG帧间过渡时极为可听闻。

发明内容

本发明的目的是提出一种音频信号处理的改良构思。更明确言之,本 发明的目的是提出一种舒缓噪声添加至音频信号的改良构思。本发明的该 目的通过根据权利要求1的音频解码器,通过权利要求17的系统,通过 权利要求18的方法及通过权利要求19的计算机程序达成。

在一个方面中,本发明提出一种被配置用于解码位串流以从其中产生 音频输出信号的音频解码器,该位串流包含接着至少一个不活动阶段的至 少一个活动阶段,其中该位串流已经于其中编码描述一背景噪声的一频谱 的至少一个静默插入描述符帧,该音频解码器包含:

一静默插入描述符解码器,被配置为解码该静默插入描述符帧以重建 该背景噪声的该频谱;

一解码装置,被配置为在该活动阶段期间从该位串流重建该音频输出 信号;

一频谱转换器,被配置为确定该音频输出信号之一频谱;

一噪声估计器装置,被配置为根据由该频谱转换器所提供的该音频输 出信号之该频谱而确定该音频输出信号之该噪声的一第一频谱,其中该音 频输出信号之该噪声的该第一频谱具有比如由该静默插入描述符解码器 所提供的该背景噪声的该频谱更高的频谱分辨率;

一分辨率转换器,被配置为根据该音频输出信号之该噪声的该第一频 谱而建立该音频输出信号之该噪声的一第二频谱,其中该音频输出信号之 该噪声的该第二频谱具有与如由该静默插入描述符解码器所提供的该背 景噪声的该频谱相同的频谱分辨率;

一舒缓噪声频谱估计装置,具有一定标因子计算装置,该定标因子计 算装置被配置为根据如由该静默插入描述符解码器所提供的该背景噪声 的该频谱,及根据如由该分辨率转换器所提供的该音频输出信号之该噪声 的该第二频谱,针对一舒缓噪声的一频谱计算定标因子,及具有舒缓噪声 频谱生成器,该舒缓噪声频谱生成器被配置为根据该等定标因子计算针对 一舒缓噪声的该频谱;及

一舒缓噪声生成器,被配置为根据针对该舒缓噪声的该频谱在该不活 动阶段期间产生该舒缓噪声。

该位串流含有活动阶段及不活动阶段,其中活动阶段为含有该音频信 息的期望成分诸如语音或乐音的一阶段,而一不活动阶段为不含有该音频 信息的任何期望成分的一阶段。不活动阶段通常出现在暂停期间,于该处 不存在有期望成分,诸如乐音或语音。因此,不活动阶段通常只含有背景 噪声。于含有编码音频信号的该位串流中的信息被嵌置于所谓的帧内,其 中此等帧各自含有指称某个时间的音频信息。于活动阶段期间,包含音频 信息包括有关该期望信号的音频信息的活动帧可在该位串流内部传输。相 反地,于不活动阶段期间,包含噪声信息的静默插入描述符帧可以比该等 活动阶段的平均比特率更低的一平均比特率而在该位串流内部传输。

静默插入描述符解码器被配置为解码该静默插入描述符帧,因而重建 该背景噪声的频谱。但此背景噪声的频谱,因在该静默插入描述符帧中传 输的参数数目有限之故,不允许捕捉该背景噪声的精密频谱结构。

解码装置可为于活动阶段期间,能够解码位串流(其为含音频信息的 一数字数据串流)的装置或计算机程序。该解码过程可获得一数字解码音 频输出信号,其可馈送至一D/A转换器以产生一模拟音频信号,其然后可 馈送至一扬声器以产生一可听闻信号。

频谱转换器可获得音频输出信号的一频谱,其具有比如由该静默插入 描述符解码器所提供的该背景噪声的频谱显著地更高的频谱分辨率。

因此,该噪声估计器可根据由该频谱转换器所提供的该音频输出信号 之频谱而确定该音频输出信号的噪声之一第一频谱,其中该音频输出信号 的噪声之该第一频谱具有比如由该静默插入描述符解码器所提供的该背 景噪声的频谱更高的频谱分辨率。

进一步地,该分辨率转换器可根据该音频输出信号的噪声之该第一频 谱而建立该音频输出信号的噪声之一第二频谱,其中该音频输出信号的噪 声之该第二频谱具有与如由该静默插入描述符解码器所提供的该背景噪 声的频谱相同的频谱分辨率。

定标因子计算装置可根据如由该静默插入描述符解码器所提供的该 背景噪声的频谱,及根据如由该分辨率转换器所提供的该音频输出信号之 噪声的该第二频谱,针对舒缓噪声的一频谱而容易地计算定标因子,原因 在于由该静默插入描述符解码器所提供的该背景噪声的频谱与该音频输 出信号之噪声的该第二频谱具有相同频谱分辨率之故。

舒缓噪声频谱生成器可根据该定标因子及根据如由噪声估计装置所 提供的该音频输出信号之噪声的该第一频谱而针对该舒缓噪声建立频谱。

此外,该舒缓噪声生成器可根据该舒缓噪声的频谱而于该不活动阶段 期间产生该舒缓噪声。

于解码器获得的噪声估值含有有关该背景噪声之频谱结构之信息,该 信息比含在该等SID帧的有关该背景噪声的平滑频谱包络之信息更准确。 但此等估值无法于不活动阶段期间更新,原因在于噪声估计是活动阶段期 间在已解码音频输出信号上进行之故。相反地,SID帧于不活动阶段期间 传递有关频谱包络的新颖信息。依据本发明之解码器组合此二信息源。定 标因子可于活动阶段期间取决于在解码器端的噪声估值更新,及于不活动 阶段期间,取决于含在SID帧的噪声估值更新。定标因子的连续更新确保 所产生的舒缓噪声特性不会有急剧改变。

因含在SID帧的该背景噪声的频谱与该音频输出信号之噪声的该第 二频谱具有相同频谱分辨率,故定标因子的更新及因而舒缓噪声的更新可 以容易的方式完成,原因在于针对含在SID帧的该背景噪声的频谱之各个 频带群组,在该音频输出信号之噪声的该第二频谱中恰存在有一个频带群 组。须注意于一优选实施例中,含在SID帧的该背景噪声的频谱之该等频 带群组与该音频输出信号之噪声的该第二频谱之该等频带群组彼此相对 应。

此外,因含在SID帧的该背景噪声的频谱与该音频输出信号之该噪声 的该第二频谱具有相同频谱分辨率,故定标因子的更新不会产生或几乎不 会产生可听闻鬼影(audible artifact)。

依据本发明之一优选实施例,该频谱分析器包含一快速傅里叶变换装 置。一快速傅里叶变换(FFT)为只需要低运算努力的计算离散傅里叶变换 (DFT)及其反变换的一算法。因此,该快速傅里叶变换装置可容易地计算 该音频输出信号之该频谱。

依据本发明之一优选实施例,在该解码器的该噪声估计器装置包含一 转换器装置,该转换器装置被配置为将该音频输出信号之该频谱转换成通 常具有远更低的一频谱分辨率之该音频输出信号之一转换频谱。通过提供 该音频输出信号之该转换频谱,可减低随后运算步骤之复杂度。

依据本发明之一优选实施例,该噪声估计器装置包含一噪声估计器, 被配置为根据由该转换器装置所提供的该音频输出信号之该转换频谱以 确定该音频输出信号之该噪声的该第一频谱。当该音频输出信号之该转换 频谱用作为于该解码器的噪声估计的基础时,可减少运算努力而不降低噪 声估计的质量。

依据本发明之一优选实施例,该定标因子计算装置被配置为根据公式 计算该定标因子,其中表示针对该舒缓噪声的一频带群 组i的一定标因子,其中表示含在SID帧中的该背景噪声的该频谱 的一频带群组i的一水平,其中表示该音频输出信号之该噪声的该 第二频谱的一频带群组i的一水平,其中i=0,…,LLR-1,其中LLR为含在SID 帧中的该背景噪声的该频谱的及该音频输出信号之该噪声的该第二频谱 的该频带群组的数目。通过此特征,可容易地计算该等定标因子。

依据本发明之一优选实施例,该舒缓噪声频谱生成器被配置为根据该 等定标因子及根据如由噪声估计器装置所提供的音频输出信号之噪声的 该第一频谱而计算舒缓噪声的该频谱。通过此特征,该舒缓噪声频谱可以 使得其具有该音频输出信号的噪声之第一频谱的频谱分辨率的方式来计 算,其通常远高于得自SID帧的该频谱分辨率。

依据本发明之一优选实施例,该舒缓噪声频谱生成器被配置为根据式 计算该舒缓噪声的该频谱,其中表示该舒缓噪 声的该频谱之一频带k之一水平,其中表示包含在SID帧中的该背 景噪声的该频谱的及该音频输出信号之该噪声的该第二频谱之一频带群 组i的一定标因子,其中表示该音频输出信号之该噪声的该第一频 谱之一频带k之一水平,其中k=bLR(i),...,bLR(i+1)-1,其中bLR(i)为该等 频带群组中之一的一第一频带,其中i=0,…,LLR-1,其中LLR为含在SID 帧中的该背景噪声的该频谱的及该音频输出信号之该噪声的该第二频谱 的该频带群组的数目。通过此特征,该舒缓噪声的频谱可容易地以高分辨 率计算。

依据本发明之一优选实施例,该分辨率转换器包含一第一转换器阶 段,被配置为根据该音频输出信号之该噪声的该第一频谱建立该音频输出 信号之该噪声的一第三频谱,其中该音频输出信号之该噪声的该第三频谱 的频谱分辨率等于或高于该音频输出信号之该噪声的该第一频谱的该频 谱分辨率,及其中该分辨率转换器包含一第二转换器阶段,被配置为建立 该音频输出信号之该噪声的该第二频谱。

依据本发明之一优选实施例,该舒缓噪声频谱生成器被配置为根据该 等定标因子及根据如由分辨率转换器的第一转换器阶段所提供的该音频 输出信号之该噪声的该第三频谱而计算该舒缓噪声的该频谱。通过此特 征,于该不活动阶段期间可获得一舒缓噪声频谱,其具有比于该活动阶段 期间该音频输出信号的噪声之第一频谱的频谱分辨率更高的频谱分辨率。

依据本发明之一优选实施例,该舒缓噪声频谱生成器被配置为根据式 计算该舒缓噪声的该频谱,其中表示该舒缓噪 声的该频谱之一频带k之一水平,其中表示如包含在SID帧中的该 背景噪声的该频谱的及该音频输出信号之该噪声的该第二频谱的频带群 组i的一定标因子,其中表示该音频输出信号之该噪声的该第三频 谱之一频带k之一水平,其中k=bLR(i),...,bLR(i+1)-1,其中bLR(i)为一频 带群组的一第一频带,其中i=0,…,LLR-1,其中LLR为如包含在SID帧中 的该背景噪声的该频谱的及该音频输出信号之该噪声的该第二频谱的频 带群组的数目。通过此特征,该舒缓噪声的频谱可容易地以高分辨率计算。

依据本发明之一优选实施例,该舒缓噪声生成器包含一第一快速傅里 叶转换器,被配置为调整于一快速傅里叶变换域中的该舒缓噪声的频带之 水平;及一第二快速傅里叶转换器,根据该第一快速傅里叶转换器的输出 产生该舒缓噪声的至少一部分。通过此特征,可容易地产生背景噪声。

依据本发明之一优选实施例,该解码装置包含一核心解码器,被配置 为于该活动阶段期间产生该音频输出信号。通过此特征,可达成适合用于 窄频(NB)及宽带(WB)应用的解码器的简单结构。

依据本发明之一优选实施例,该解码装置包含一核心解码器,被配置 为产生一音频信号;及一带宽扩延模块,被配置为根据如由该核心解码器 所提供的该音频信号而产生该音频输出信号。通过此特征,可达成适合用 于超宽带(SWB)应用的解码器之简单结构。

依据本发明之一优选实施例,该带宽扩延模块包含频带复制解码器、 正交镜像滤波分析器、及/或正交镜像滤波合成器。

依据本发明之一优选实施例,如由该快速傅里叶转换器所提供的该舒 缓噪声被馈送至该带宽扩延模块。通过此特征,由该快速傅里叶转换器所 提供的该舒缓噪声可变换成具有较高带宽的一舒缓噪声。

依据本发明之一优选实施例,该舒缓噪声生成器包含正交镜像滤波调 整器装置,被配置为调整于一正交镜像滤波域中的该舒缓噪声的频带水 平,其中该正交镜像滤波调整器装置的输出被馈送至该带宽扩延模块。通 过此等特性,与高于该核心解码器带宽的噪声频率相关的由该静默插入描 述符帧所传输的噪声信息可用以进一步改良舒缓噪声。

在另一方面中,本发明涉及一种包含解码器及编码器的系统,其中该 解码器是依据本发明设计。

在又一方面中,本发明涉及一种解码位串流以从其中产生音频输出信 号的方法,该位串流包含接着至少一个不活动阶段的至少一个活动阶段, 其中该位串流已经于其中编码描述一背景噪声的频谱的至少一个静默插 入描述符帧,该方法包含下列步骤:

解码该静默插入描述符帧以重建该背景噪声的该频谱;

于该活动阶段期间从该位串流重建该音频输出信号;

确定该音频输出信号的一频谱;

根据该音频输出信号的该频谱而确定该音频输出信号的该噪声的一 第一频谱,其中该音频输出信号的该噪声的该第一频谱具有比如由静默插 入描述符解码器所提供的该背景噪声的该频谱更高的频谱分辨率;

根据该音频输出信号之该噪声的该第一频谱而建立该音频输出信号 之该噪声的一第二频谱,其中该音频输出信号之该噪声的该第二频谱具有 与如由静默插入描述符解码器所提供的该背景噪声的该频谱相同的频谱 分辨率;

根据如由静默插入描述符解码器所提供的该背景噪声的该频谱及根 据该音频输出信号之该噪声的该第二频谱,针对一舒缓噪声的一频谱计算 定标因子;及

根据针对该舒缓噪声的该频谱在该不活动阶段期间产生该舒缓噪声。

在进一步方面中,本发明涉及一种计算机程序,当在计算机或处理器 上运行时用以执行本发明之方法。

附图说明

接着将就附图讨论本发明的优选实施例,附图中:

图1示出依据本发明的解码器的第一实施例;

图2示出依据本发明的解码器的第二实施例;

图3示出依据本发明的解码器的第三实施例;

图4示出适用于本发明系统的编码器的第一实施例;及

图5示出适用于本发明系统的编码器的第二实施例。

具体实施方式

图1示出依据本发明的解码器1的第一实施例。图1描绘的音频解码 器1被配置为解码位串流BS,因而从其中产生一音频输出信号OS,该位 串流BS包含接着为至少一个不活动阶段的至少一个活动阶段,其中该位 串流BS已经于其中编码至少一个静默插入描述符帧SI,其描述一背景噪 声的频谱SBN,该音频解码器1包含:

解码装置2,被配置为在该活动阶段期间从该位串流BS重建该音频 输出信号OS;

静默插入描述符解码器3,被配置为解码该静默插入描述符帧SI,因 而重建该背景噪声的频谱SBN;

频谱转换器4,被配置为确定该音频输出信号OS之频谱SAS;

噪声估计器装置5,被配置为根据由该频谱转换器4所提供的该音频 输出信号AS之频谱SAS而确定该音频输出信号OS的噪声之一第一频谱 SN1,其中该音频输出信号OS的噪声之该第一频谱SN1具有比该背景噪 声的频谱SBN更高的频谱分辨率;

分辨率转换器6,被配置为根据该音频输出信号OS的噪声之该第一 频谱SN1而建立该音频输出信号OS的噪声之一第二频谱SN2,其中该音 频输出信号OS的噪声之该第二频谱SN2具有与该背景噪声的频谱SBN 相同的频谱分辨率;

舒缓噪声频谱估计装置7,具有定标因子计算装置7a,定标因子计算 装置被配置为根据如由该静默插入描述符解码器3所提供的该背景噪声的 频谱SBN,及根据如由该分辨率转换器6所提供的该音频输出信号OS之 噪声的该第二频谱SN2,针对该舒缓噪声CN的一频谱SCN计算定标因 子SF,及具有舒缓噪声频谱生成器7b,舒缓噪声频谱生成器被配置为根 据该等定标因子SF计算针对一舒缓噪声CN的该频谱SCN;及

一舒缓噪声生成器8,被配置为根据针对该舒缓噪声CN的该频谱 SCN在该不活动阶段期间产生该舒缓噪声CN。

该位串流BS含有活动阶段及不活动阶段,其中一活动阶段为含有该 音频信息的期望成分诸如语音或乐音之一阶段,而一不活动阶段为不含有 该音频信息的任何期望成分之一阶段。不活动阶段通常出现在暂停期间, 于该处不存在有期望成分,诸如乐音或语音。因此,不活动阶段通常只含 有背景噪声。于含有编码音频信号的该位串流BS中之信息被嵌置于所谓 的帧内,其中此等帧各自含有指称某个时间的音频信息。于活动阶段期间, 包含音频信息包括有关该期望信号的音频信息之活动帧可在该位串流BS 内部传输。相反地,于不活动阶段期间,包含噪声信息的静默插入描述符 帧SI可以比该活动阶段的平均比特率更低的平均比特率而在该位串流内 部传输。

解码装置2可为于活动阶段期间,能够解码音频位串流BS,其为含 音频信息的数字数据串流的装置或计算机程序。该解码过程可获得一数字 解码音频输出信号OS,其可馈送至一D/A转换器以产生一模拟音频信号, 其然后可馈送至一扬声器以产生一可听闻信号。

静默插入描述符解码器3被配置为解码该静默插入描述符帧SI,因而 重建该背景噪声的频谱SBN。但此背景噪声的频谱SBN,因在该静默插 入描述符帧SI中传输的参数数目有限之故,不允许捕捉该背景噪声的精 密频谱结构。

频谱转换器4可获得音频输出信号OS的频谱SAS,其具有比较如由 该静默插入描述符解码器3所提供的该背景噪声的频谱SBN显著地更高 的频谱分辨率。

因此,噪声估计器10可根据由该频谱转换器4所提供的该音频输出 信号OS之频谱SAS而确定该音频输出信号OS的噪声之一第一频谱SN1, 其中该音频输出信号OS的噪声之该第一频谱SN1具有比该背景噪声的频 谱SBN更高的频谱分辨率。

此外,该分辨率转换器6可根据该音频输出信号OS的噪声之该第一 频谱SN1而建立该音频输出信号OS的噪声之一第二频谱SN2,其中该音 频输出信号OS的噪声之该第二频谱SN2具有与该背景噪声的频谱SBN 相同的频谱分辨率。

定标因子计算装置7a可根据如由该静默插入描述符解码器3所提供 的该背景噪声的频谱SBN,及根据如由该分辨率转换器6所提供的该音频 输出信号OS之噪声的该第二频谱SN2,针对舒缓噪声CN的一频谱SCN 而容易地计算定标因子SF,原因在于该背景噪声的频谱SBN与该音频输 出信号OS之噪声的该第二频谱SN2具有相同频谱分辨率之故。

舒缓噪声频谱生成器7b可根据该定标因子SF针对该舒缓噪声CN建 立频谱SCN。

此外,舒缓噪声生成器8可根据针对该舒缓噪声CN的该频谱SCN 而在该不活动阶段期间产生该舒缓噪声CN。

于解码器1获得的噪声估值含有有关该背景噪声之频谱结构之信息, 该信息系比含在该等SID帧SI的有关该背景噪声之频谱结构之信息更准 确。但此等估值无法于不活动阶段期间调整,原因在于噪声估计时在已解 码音频输出信号OS上进行之故。相反地,SID帧于不活动阶段期间,以 一定时间间隔传递有关频谱包络的新颖信息。依据本发明之解码器1组合 此二数据源。定标因子SF可于活动阶段期间取决于在解码器端的噪声估 值更新,及于不活动阶段期间,取决于含在SID帧SI的噪声估值更新。 定标因子SF的连续更新确保所产生的舒缓噪声CN特性不会有急剧改变。

因含在SID帧SI的该背景噪声的频谱SBN与该音频输出信号OS之 噪声的该第二频谱SN2具有相同频谱分辨率,故定标因子SF的更新及因 而舒缓噪声CN的更新可以容易的方式完成,原因在于针对含在SID帧 SI的该背景噪声的频谱SBN的各个频带群组,在该音频输出信号OS之 噪声的该第二频谱SN2中恰存在有一个频带群组。须注意于一优选实施例 中,含在SID帧SI的该背景噪声的频谱SBN的该等频带群组与该音频输 出信号OS之噪声的该第二频谱SN2之该等频带群组彼此相对应。

此外,因含在SID帧SI的该背景噪声的频谱SBN与该音频输出信号 OS之噪声的该第二频谱SN2具有相同频谱分辨率,故定标因子SF的更 新不会产生或几乎不会产生可听闻鬼影。

依据本发明之一优选实施例,频谱分析器4包含快速傅里叶变换装置。 快速傅里叶变换(FFT)乃只需极少运算努力来计算离散傅里叶变换(DFT) 及其反变换的算法。因此,快速傅里叶变换装置可以容易方式计算音频输 出信号OS之频谱SAS。

依据本发明之一优选实施例,噪声估计器装置5包含转换器装置9, 其被配置为将音频输出信号OS之频谱SAS转换成该音频输出信号OS之 转换频谱CSA,其具有与核心解码器17相同的频谱分辨率。概略言之, 由频谱转换器4所得的音频输出信号OS之频谱SAS之频谱分辨率远高于 该核心解码器17的频谱分辨率。通过提供音频输出信号OS之转换频谱 CSA,可减低随后运算步骤之复杂度。

依据本发明之一优选实施例,噪声估计器装置5包含噪声估计器10, 被配置为根据由转换器装置9所提供的音频输出信号OS之转换频谱CAS 而确定该音频输出信号OS之噪声的该第一频谱SN1。当音频输出信号OS 之转换频谱CSA用作为在解码器的噪声估计的基础时,可减低运算努力 而不会降低噪声估计质量。

依据本发明之一优选实施例,定标因子计算装置7a被配置为根据下 式运算定标因子SF,其中表示针对舒缓噪声CN的一 频带群组i的一定标因子SF,其中表示背景噪声的频谱SBN的一 频带群组i的水平,其中表示音频输出信号OS之噪声的该第二频谱 SN2的一频带群组i的水平,其中i=0,…,LLR-1,其中LLR为该背景噪声的 频谱SBN的及该音频输出信号OS之噪声的该第二频谱SN2的频带群组 数目。通过此等特征可容易地运算定标因子SF。

依据本发明之一优选实施例,舒缓噪声频谱生成器7b被配置为根据 该等定标因子SF及根据如由噪声估计器装置5所提供的音频输出信号OS 之噪声的该第一频谱SN1而计算舒缓噪声CN的该频谱SCN。通过此等 特征,舒缓噪声频谱SCN可以使得其具有音频输出信号OS之噪声的该第 一频谱SN1的频谱分辨率的方式来计算。

依据本发明之一优选实施例,舒缓噪声频谱生成器7b被配置为根据 式运算舒缓噪声CN的该频谱SCN,其中表示 舒缓噪声CN的该频谱SCN的频带k之一水平,其中表示背景噪声 的频谱SBN的及音频输出信号OS之噪声的该第二频谱SN2的频带群组i 的一定标因子SF,其中表示音频输出信号OS之噪声的该第一频谱 SN1之一频带k之一水平,其中k=bLR(i),...,bLR(i+1)-1,其中bLR(i)为该 等频带群组中之一的一第一频带,其中i=0,…,LLR-1,其中LLR为该背景噪 声的频谱SBN的及该音频输出信号OS之噪声的该第二频谱SN2的频带 群组数目。通过此等特征可容易地以高分辨率计算该舒缓噪声CN的该频 谱SCN。

依据本发明之一优选实施例,分辨率转换器6包含一第一转换器阶段 11,其被配置为根据该音频输出信号OS之噪声的该第一频谱SN1建立音 频输出信号OS之噪声的一第三频谱SN3,其中该音频输出信号OS之噪 声的该第三频谱SN3的频谱分辨率等于或高于音频输出信号OS之噪声的 该第一频谱SN1的频谱分辨率,及其中该分辨率转换器6包含一第二转换 器阶段12,其被配置为建立该音频输出信号OS之噪声的该第二频谱SN2。

依据本发明之一优选实施例,舒缓噪声频谱生成器7b被配置为根据 该定标因子SF及根据如由分辨率转换器6的第一转换器阶段11所提供的 音频输出信号OS之噪声的该第三频谱SN3而计算舒缓噪声CN的该频谱 SCN。通过此等特征,可获得具有比由静默插入描述符解码器3所提供的 背景噪声频谱SBN更高频谱分辨率的一舒缓噪声频谱SCN。

依据本发明之一优选实施例,舒缓噪声频谱生成器7b被配置为根据 式运算舒缓噪声CN的该频谱SCN,其中表示 舒缓噪声CN的该频谱SCN之一频带k之一水平,其中表示背景噪 声的频谱SBN的及音频输出信号OS之噪声的该第二频谱SN2的频带群 组i的一定标因子SF,其中表示音频输出信号OS之噪声的该第三 频谱SN3之一频带k之一水平,其中k=bLR(i),...,bLR(i+1)-1,其中bLR(i) 为该等频带群组中之一者的一第一频带,其中i=0,…,LLR-1,其中LLR为该 背景噪声的频谱SBN的及该音频输出信号OS之噪声的该第二频谱SN2 的频带群组数目。通过此等特征可容易地以高分辨率计算该舒缓噪声CN 的该频谱SCN。

依据本发明之一优选实施例,该舒缓噪声生成器8包含第一快速傅里 叶转换器15,其被配置为调整于一快速傅里叶变换定义域中的该舒缓噪声 CN之频带水平,及一第二快速傅里叶转换器16,其根据该第一快速傅里 叶转换器15的输出而产生该舒缓噪声CN的至少一部分。通过此等特征, 可以容易方式产生舒缓噪声。

依据本发明之一优选实施例,该解码装置2包含核心解码器17,其被 配置为于活动阶段期间产生音频输出信号OS。通过此等特征,可达成适 合窄频(NB)及宽带(WB)应用的解码器之简单结构。

依据本发明之一优选实施例,音频解码器1包含标头读取装置18,其 被配置为区别活动阶段与不活动阶段。标头读取装置18进一步被配置为 切换一切换装置19,使得于活动阶段期间位串流BS被馈送至核心解码器 17,及于不活动阶段期间,静默插入描述符帧被馈送至静默插入描述符解 码器3。此外,一不活动阶段标记被传输给该舒缓噪声生成器8,因而可 触发该舒缓噪声CN之生成。

图2示出依据本发明之音频解码器1的第二实施例。图2描绘之解码 器1是基于图1的解码器1。后文中将只解释其差异。本发明之第二实施 例的音频解码器1包含一带宽扩延模块20,该核心解码器17的输出信号 被馈送至带宽扩延模块中。该带宽扩延模块20被配置为根据该音频输出 信号OS而产生一带宽扩延输出信号EOS。通过此等特征,可达成适合超 宽带(SWB)应用的解码器1之简单结构。

依据本发明之一优选实施例,如由快速傅里叶转换器16所提供的舒 缓噪声CN被馈送至带宽扩延模块20。通过此等特征,由快速傅里叶转换 器16所提供的舒缓噪声CN可变换成具有较高带宽的舒缓噪声CN。

依据本发明之一优选实施例,该舒缓噪声生成器8包含正交镜像滤波 调整器装置24,其被配置为调整于一正交镜像滤波定义域中的该舒缓噪声 CN之频带水平,其中该正交镜像滤波合成器24的输出被馈送至该带宽扩 延模块20作为一额外舒缓噪声CN’。含在该静默插入描述符帧SI内的 QMF水平可被馈送至该正交镜像滤波合成器装置24。通过此等特征,高 于该核心解码器17的带宽的噪声频率有关的该静默插入描述符帧SI所传 输的噪声信息可用以进一步改良该舒缓噪声CN。

依据本发明之一优选实施例,该带宽扩延模块20包含频带复制解码 器21、正交镜像滤波分析器22及/或正交镜像滤波合成器23。

图3示出依据本发明之音频解码器1的第三实施例。图3描绘之解码 器1是根据图2的解码器1。后文中将只讨论其差异。

依据本发明之一优选实施例,解码装置2包含核心解码器17,其被配 置为产生一音频信号AS,及一带宽扩延模块20,其被配置为根据如由核 心解码器17所提供的音频信号AS而产生音频输出信号OS。通过此等特 征,可达成适合超宽带(SWB)应用的解码器之简单结构。

大体上,图3的带宽扩延模块20与图2的带宽扩延模块20相同。但 在根据本发明之音频解码器1的第三实施例中,该带宽扩延模块20被用 以产生音频输出信号OS,该OS被馈送至频谱转换器4。通过此等特征, 整个带宽可用以产生舒缓噪声。

有关依据本发明之音频解码器的三个实施例,可增加:在解码器端, 一随机生成器8可施用以激励FFT域的、以及针对SWB模式的QMF域 的各个个别频带。随机序列的幅值须于各个频带个别运算,使得所生成的 舒缓噪声CN的频谱类似存在于位串流中的实际背景噪声的频谱。

在解码器1获得的高分辨率噪声估值捕捉有关背景噪声的精密频谱结 构之信息。但于不活动阶段期间此等估值无法调整,原因在于噪声估计是 在解码信号OS上进行的。相反地,SID帧SI于不活动阶段期间,以一定 时间间隔传递有关频谱包络的新颖信息。本解码器1组合此二信息源,致 力于再现在活动阶段期间从背景噪声所捕捉的精密频谱结构,而在不活动 部分期间,借助于该SID信息只更新舒缓噪声CN的频谱包络。

如图1至图3显示,为了达成此项目标,额外噪声估计器5用在解码 器1。因此噪声估计是在传输系统的两端进行,但于解码器1运用比于编 码器100更高的频谱分辨率。在解码器1获得高频谱分辨率的一种方式是 单纯个别考虑各个频带(全分辨率),而非如同于编码器100透过平均将频 带集合成组。另外,通过也在解码器1进行频谱的集合成组但使用比编码 器100更高数目的频带群组,通过此在解码器获得频率轴更精密的量化, 可在频谱分辨率与运算复杂度间获得折衷。

注意解码器端噪声估计在已解码信号OS上运算。在以DTX为基础 的系统中,因而须能够只于活动阶段期间运算,亦即必须在清晰语音内容 或吵杂语音内容上运算(与只有噪声相反)。

在解码器计算的高分辨率(HR)噪声功率频谱可首先经内插(例如 使用线性内插)以提供一全分辨率(FR)功率频谱然后恰如同于编码器 所为,通过频谱分组(亦即求平均)而被转成低分辨率(LR)功率频谱因此功率频谱具有与得自SID帧SI的噪声水平相同的频谱分辨 率。比较低分辨率噪声频谱与全分辨率噪声频谱最终可定标 以获得全分辨率功率频谱如下:

N^FR(k)=N^SIDLR(i)N^decLR(i).N^decFR(k),k=bLR(i),...,bLR(i+1)-1,i=0,...,LLR-1,

于该处LLR为由在编码器的低分辨率噪声估计所使用的频谱群组数 目,及bLR(i)表示第i个频谱群组的第一频带,i=0,…,LLR-1。全分辨率噪 声功率频谱最终可用以准确地调整于各个个别FFT或QMF频带(后 者只用于SWB模式)所生成的舒缓噪声水平。

于图1及图2中,前述机制只施加至FFT系数。因此,针对SWB系 统,该机制不施加于QMF频带捕捉由核心所留下的高频内容。由于此等 频率在知觉上较为不相关,通常针对此等频率再现噪声的平滑频谱包络是 足够的。

为了调整针对于SWB模式中高于核心带宽的频率施加于QMF域的 舒缓噪声水平,系统只仰赖由SID帧传输的信息。如此当VAD触发CNG 帧时,SBR模块被绕道。于WB模式中,CNG模块并未考虑QMF频带, 原因在于施用盲带宽扩延以恢复期望的带宽之故。

虽然如此,通过将解码器端噪声估计器施加于带宽扩延模块之输出, 而非施加于核心解码器的输出,该方案可容易地扩充以涵盖整个带宽。如 图3显示的此种扩延造成运算复杂度增高,原因在于也须考虑由QMF滤 波器组所捕捉的高频率之故。

图4示出适用于本发明系统的编码器100之第一实施例。输入音频信 号IS被馈送至第一频谱转换器25,其被配置为转移该时域信号IS至频域。 第一频谱转换器25可为正交镜像滤波分析器。第一频谱转换器25的输出 被馈送至第二频谱转换器26,其被配置为转移第一频谱转换器25的输出 至一域。第二频谱转换器26可为正交镜像滤波合成器。第二频谱转换器 26的输出被馈送至第三频谱转换器27,其可为快速傅里叶变换装置。第 三频谱转换器27之输出馈送至噪声估计器装置28,其包含一转换装置29 及一噪声估计器30。

又,编码器100包含信号活动检测器31,其被配置为切换切换装置 32,使得于活动阶段期间,输入信号被馈送至一核心编码器33;及于不活 动阶段期间,于SID帧中由噪声估计装置28所产生的噪声估计被馈送至 静默插入描述符编码器35。又,于不活动阶段中,不活动标记被馈送至一 核心更新器34。

编码器100进一步包含位串流产生器36,其接收来自静默插入描述符 编码器35的静默插入描述符帧SI及来自核心编码器33的编码输入信号 ISE以从其中产生位串流BS。

图5示出适用于本发明系统的编码器100之第二实施例,其为根据第 一实施例的编码器100。后文中将简短地解释第二实施例之额外特征。第 一转换器25的输出也馈送至噪声估计器装置28。另外,于活动阶段期间, 频带复制编码器37产生一加强信号ES,其含有于该输入音频信号IS中 有关较高频的信息。该加强信号37也转移至位串流产生器36,因而将该 加强信号ES嵌置于该位串流BS内。

有关图4及图5显示的编码器,可增加下列信息:以语音活动检测器 (VAD)触发CNG阶段为例,传输含有有关输入背景噪声的信息之SID帧。 如此将许可解码器生成一人造噪声,就频-时特性而言类似实际背景噪声。 为了达成此项目的,如图4及图5显示,噪声估计器28被施加于编码器 端以追踪存在于该输入信号IS内的背景噪声之频谱形状。

大体上,噪声估计可使用任一种频-时分析工具将一时域信号分解成 多个频带而施用,只要其提供足够的频谱分辨率即可。于本系统中,QMF 滤波器组用作为重新取样工具以降低输入信号的取样率至核心取样率。其 具有比FFT显著更低的频谱分辨率,FFT被施加至已降低取样的核心信 号。

因该核心编码器33已经涵盖整个NB带宽,且因WB模式仰赖盲带 宽扩延,高于核心带宽的频率乃不相关,而针对NB及WB系统单纯可抛 弃。相反地,于SWB模式中,该等频率可通过上QMR频带捕捉且须明 确地列入考虑。

实际上SID帧SI的大小极为有限。因此,描述背景噪声的参数数目 须维持为尽可能地少。为了达成此项目的,噪声估计不直接施用于频谱变 换的输出。取而代之,通过在频带群组中求取输入功率频谱的平均,例如 遵照巴克(Bark)标度而以较低频谱分辨率施用。求平均可通过算术或几何 手段达成。以SWB为例,频谱分组针对FFT域及QMF域分开进行,而 NB模式及WB模式只仰赖FFT域。

注意减低频谱分辨率就运算复杂度而言也有利,原因在于噪声估计只 须施用至少数频带群组,而非个别地考虑各个频带。

估计噪声水平(各个频带群组各有一个)能够使用向量量化技术而联合 地编码于SID帧。于NB模式及WB模式中只探勘FFT域。相反地,针 对SWB模式,使用向量量化可联合地对FFT域及QMF域二者执行SID 帧的编码,换言之,诉诸涵盖二域的单一码簿。

虽然已经以设备脉络描述若干方面,但显然此等方面也表示相对应方 法的描述,于该处一方块或一装置是相对应于一方法步骤或一方法步骤的 特征。同理,以方法步骤的脉络描述之方面也表示一相对应设备的一相对 应方块或项目或特性件的描述。部分或全部方法步骤可通过(或使用)硬设 备执行,例如微处理器、可编程计算机或电子电路。于若干实施例中,最 重要的方法步骤中的一个或多个可通过此种设备执行。

取决于某些具现要求,本发明之实施例可以硬件或于软件实施。该实 施可使用非暂时性存储介质执行,诸如数字存储介质,例如软盘、DVD、 蓝光盘、CD、ROM、PROM、及EPROM、EEPROM或闪存,具有可电 子读取控制信号储存于其上,其与可编程计算机系统协作(或能够协作)因 而执行各个方法。因此,数字存储介质可为可计算机可读的。

依据本发明之若干实施例包含具有可电子读取控制信号的一数据载 体,其能够与可编程计算机系统协作因而执行此处描述的方法中之一。

大致上言之,本发明之实施例可体现为具有一程序代码的计算机程序 产品,当该计算机程序产品在一计算机上运行时该程序代码可操作以执行 该等方法中之一。该程序代码例如可储存于机器可读取载体上。

其它实施例包含储存于机器可读取载体上用以执行此处描述的方法 中之一的计算机程序。

换言之,因此本发明之实施例为具有一程序代码的计算机程序,当该 计算机程序在一计算机上运行时该程序代码可执行该等方法中之一。

本发明方法之又一实施例因而为包含用以执行此处描述的方法中之 一者的计算机程序记录于其上的一数据载体(或数字存储介质,或计算机 可读取介质)。该数据载体、数字存储介质或记录介质典型地为有形及/或 非暂时性的。

因此,本发明方法之又一实施例为表示用以执行此处描述的方法中之 一的计算机程序之一数据串流或信号序列。该数据串流或该信号序列例如 可被配置为透过数据通信连结,例如透过因特网移转。

进一步实施例包含一处理装置,例如计算机或可编程逻辑设备,其被 配置为或适用以执行此处描述的方法中之一。

又一实施例包含用以执行此处描述的方法中之一的计算机程序安装 于其上的一计算机。

依据本发明之又一实施例包含一设备或系统,其被配置为转移(例如 电子式或光学式)用以执行此处描述的方法中之一的计算机程序给接收 器。该接收器例如可为计算机、移动装置、存储器装置等。该设备或系统 例如可包含一文件服务器用以移转计算机程序给接收器。

于若干实施例中,可编程逻辑设备(例如现场可编程门阵列)可用以从 事此处描述的方法之部分或全部功能。于若干实施例中,现场可编程门阵 列可与微处理器协作以执行此处描述的方法中之一。通常,该等方法优选 地可通过任何硬设备执行。

前文描述的实施例仅用于示例说明本发明的原理。须了解此处描述的 配置及细节的修正及变化将为本领域的技术人员易知。因此,意图本发明 仅受未决专利的权利要求书的范围所限,而非受为了描述与解释此处实施 例所呈示的特定细节所限。

参考标号

1…音频解码器

2…解码装置

3…静默插入描述符解码器

4…频谱转换器

5…噪声估计器装置

6…分辨率转换器

7…舒缓噪声频谱估计装置

7a…定标因子计算装置

7b…舒缓噪声频谱生成器

8…舒缓噪声生成器

9…转换器装置

10…噪声估计器

11…第一转换器阶段

12…第二转换器阶段

15…第一快速傅里叶转换器

16…第二快速傅里叶转换器

17…核心解码器

18…标头读取装置

19…切换装置

20…带宽扩延模块

21…频带复制解码器

22…正交镜像滤波分析器

23…正交镜像滤波合成器

24…正交镜像滤波调整器装置

25…第一频谱转换器

26…第二频谱转换器

27…第三频谱转换器

28…噪声估计器装置

29…转换器装置

30…噪声估计器

31…信号活动检测器

32…切换装置

33…核心编码器

34…核心更新器

35…静默插入描述符编码器

36…位串流产生器

37…频带复制编码器

100…编码器

BS…位串流

OS…音频输出信号

SI…静默插入描述符帧

SBN…背景噪声频谱

SAS…音频信号频谱

SN1…音频信号的噪声的第一频谱

SN2…音频信号的噪声的第二频谱

SF…定标因子

SCN…舒缓噪声频谱

CN…舒缓噪声

AS…输出信号

CSA…音频信号的转换频谱

SN3…音频信号的噪声的第三频谱

EOS…带宽扩延输出信号

IS…输入音频信号

ISE…编码输入信号

ES…加强信号

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号