首页> 中国专利> 语音解码装置、语音编码装置、语音解码方法以及语音编码方法

语音解码装置、语音编码装置、语音解码方法以及语音编码方法

摘要

本发明提供语音解码装置、语音编码装置、语音解码方法以及语音编码方法。语音解码装置(1)具有:解复用部(1a)、低频带解码部(1b)、频带分割滤波器组部(1c)、编码序列解析部(1d)、编码序列解码/逆量化部(1e)、高频带生成部(1h)、取得多个低频带的时间包络的低频带时间包络计算部(1f

著录项

  • 公开/公告号CN104916290A

    专利类型发明专利

  • 公开/公告日2015-09-16

    原文格式PDF

  • 申请/专利权人 株式会社NTT都科摩;

    申请/专利号CN201510324219.1

  • 发明设计人 菊入圭;山口贵史;

    申请日2012-02-16

  • 分类号

  • 代理机构北京三友知识产权代理有限公司;

  • 代理人李辉

  • 地址 日本东京都

  • 入库时间 2023-12-18 10:55:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-06

    授权

    授权

  • 2015-10-14

    实质审查的生效 IPC(主分类):G10L21/0388 申请日:20120216

    实质审查的生效

  • 2015-09-16

    公开

    公开

说明书

本申请是申请日为:2012年2月16日、申请号为:201280009009.8 (PCT/JP2012/053700)、发明名称为“语音解码装置、语音编码装置、语音解码方法、 语音编码方法、语音解码程序以及语音编码程序”的发明专利申请的分案申请。

技术领域

本发明涉及语音解码装置、语音编码装置、语音解码方法、语音编码方法、语音 解码程序以及语音编码程序。

背景技术

利用听觉心理去除人类知觉所不需要的信息而将信号的数据量压缩为几十分之 一的语音音频编码技术在信号的传送和积蓄中是极为重要的技术。作为广泛使用的知 觉音频编码技术的例子,可列举由ISO/IEC MPEG(Moving Picture Experts Group:活 动图像专家组)标准化的MPEG4 AAC(Advanced Audio Coding:高级音频编码)等。

另外,作为进一步提高语音编码的性能利用低比特率获得高语音质量的方法,近 年来广泛采用了利用语音的低频成分来生成高频成分的频带扩展技术。该频带扩展技 术的代表例是MPEG4 AAC中利用的SBR(Spectral Band Replication:频带复制)技 术。在这种SBR中,针对通过QMF(Quadrature Mirror Filter:正交镜像滤波器)组 变换到频域的信号,进行从低频带到高频带的频谱系数的复写,由此生成高频成分, 然后,通过调整复写的系数的频谱包络和调性(tonality)来进行高频成分的调整。以 下,将频谱包络和调性的调整称为“频率包络的调整”。这种利用了频带扩展技术的 语音编码方式可以仅使用少量的辅助信息来再现信号的高频成分,因此对于语音编码 的低比特率化是有效的。

此处,在以SBR为代表的频域中的频带扩展技术中,由于进行对频域中表现的 频谱系数的频谱包络进行调整,在对语音信号、拍手音及响板音这样的时间包络变化 大的语音信号进行编码时,有时在解码信号中会感知到被称为前回声(pre echo)或 后回声(post echo)的残音状的噪声。这个问题是由于在调整处理的过程中高频成分 的时间包络变形并且多数情况下成为比调整前更平坦的形状所造成的。由于调整处理 而变平坦的高频成分的时间包络与编码前的原始信号中的高频成分的时间包络不一 致,成为产生前回声/后回声的原因。

作为该问题的解决方法,公知有如下方法(参照下面的专利文献1)。即,如下 这样的方法:按照频域信号的每个时隙取得低频成分的功率,根据取得的功率,提取 时间包络信息,对于提取出的时间包络信息,在利用辅助信息进行调整后,将其叠加 在被施加了频率包络调整处理的高频成分中。以下,将上述方法称为“时间包络变形 方法”。可确认到利用该方法能够将解码信号的时间包络调整为失真少的形状而得到 改善了前回声/后回声的再现信号。

现有技术文献

专利文献

专利文献1:国际公开2010/114123号公报

发明内容

发明要解决的课题

此处,在上述专利文献1记载的时间包络变形的方法中,在得到仅包含根据输入 的复用比特流而得到的低频成分的解码信号后,根据该解码信号得到QMF区域的信 号。进而,根据QMF区域的信号,取得时间包络信息,再使用参数对该时间包络信 息进行调整,然后,使用调整后的时间包络信息实施以高频成分的QMF区域信号为 对象的时间包络变形处理。

但是,在上述时间包络变形方法中,由于使用作为根据低频成分的QMF区域的 信号而得到的时间函数的单一时间包络信息进行时间包络变形处理,所以在该低频成 分的时间包络与高频成分的时间包络的相关不充分的情况下,很难进行时间包络的波 形调整。其结果是,存在解码信号中的前回声以及后回声未得到充分改善的趋势。

因此,本发明是鉴于这种课题而完成的,其目的在于提供能够通过将解码信号中 的时间包络调整为失真少的形状来得到充分改善了前回声和后回声的再现信号的语 音解码装置、语音编码装置、语音解码方法、语音编码方法、语音解码程序以及语音 编码程序。

用于解决课题的手段

为了解决上述课题,本发明的一个方面的解码装置是对编码序列进行解码的语音 解码装置,该编码序列是对语音信号进行编码而得到的,该语音解码装置具有:解复 用单元,其将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码单元, 其对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信号;频率变 换单元,其将低频带解码单元得到的低频带信号变换到频域;高频带编码序列解析单 元,其对由解复用单元解复用得到的高频带编码序列进行解析,取得编码后的高频带 生成用辅助信息以及时间包络信息;编码序列解码逆量化单元,其对由高频带编码序 列解析单元取得的高频带生成用辅助信息以及时间包络信息进行解码和逆量化;高频 带生成单元,其根据由频率变换单元变换到频域的低频带信号,使用由编码序列解码 逆量化单元解码后的高频带生成用辅助信息,生成语音信号的频域的高频带成分;第 1~第N低频带时间包络计算单元,它们对由频率变换单元变换到频域的低频带信号 进行分析,取得多个低频带的时间包络,其中N为2以上的整数;时间包络计算单 元,其使用编码序列解码逆量化单元取得的时间包络信息、以及低频带时间包络计算 单元取得的多个低频带的时间包络,计算高频带的时间包络;时间包络调整单元,其 使用由时间包络计算单元取得的时间包络,调整由高频带生成单元生成的高频带成分 的时间包络;以及逆频率变换单元,其将时间包络调整单元调整后的高频带成分与低 频带解码单元解码出的低频带信号相加,输出包含整个频带成分的时域信号。

或者,另一方面的解码装置是对编码序列进行解码的语音解码装置,该编码序列 是对语音信号进行编码而得到的,该语音解码装置具有:解复用单元,其将编码序列 解复用为低频带编码序列和高频带编码序列;低频带解码单元,其对由解复用单元解 复用得到的低频带编码序列进行解码,得到低频带信号;频率变换单元,其将低频带 解码单元得到的低频带信号变换到频域;高频带编码序列解析单元,其对由解复用单 元解复用得到的高频带编码序列进行解析,取得编码后的高频带生成用辅助信息、频 率包络信息以及时间包络信息;编码序列解码逆量化单元,其对由高频带编码序列解 析单元取得的高频带生成用辅助信息、频率包络信息以及时间包络信息进行解码和逆 量化;高频带生成单元,其根据由频率变换单元变换到频域的低频带信号,使用由编 码序列解码逆量化单元解码后的高频带生成用辅助信息,生成语音信号的频域的高频 带成分;第1~第N低频带时间包络计算单元,它们对由频率变换单元变换到频域的 低频带信号进行分析,取得多个低频带的时间包络,其中N为2以上的整数;时间 包络计算单元,其使用编码序列解码逆量化单元取得的时间包络信息、以及低频带时 间包络计算单元取得的多个低频带的时间包络,计算高频带的时间包络;频率包络叠 加单元,其将由编码序列解码逆量化单元取得的频率包络信息叠加在高频带的时间包 络中,取得时间频率包络;时间频率包络调整单元,其使用由时间包络计算单元取得 的时间包络以及由频率包络叠加单元取得的时间频率包络,调整由高频带生成单元生 成的高频带成分的时间包络和频率包络;以及逆频率变换单元,其将时间包络调整单 元调整后的高频带成分与低频带解码单元解码出的低频带信号相加,输出包含整个频 带成分的时域信号。

或者,另一方面的解码装置是对编码序列进行解码的语音解码装置,该编码序列 是对语音信号进行编码而得到的,该语音解码装置具有:解复用单元,其将编码序列 解复用为低频带编码序列和高频带编码序列;低频带解码单元,其对由解复用单元解 复用得到的低频带编码序列进行解码,得到低频带信号;频率变换单元,其将低频带 解码单元得到的低频带信号变换到频域;高频带编码序列解析单元,其对由解复用单 元解复用得到的高频带编码序列进行解析,取得编码后的高频带生成用辅助信息、频 率包络信息以及时间包络信息;编码序列解码逆量化单元,其对由高频带编码序列解 析单元取得的高频带生成用辅助信息、频率包络信息以及时间包络信息进行解码和逆 量化;高频带生成单元,其根据由频率变换单元变换到频域的低频带信号,使用由编 码序列解码逆量化单元解码后的高频带生成用辅助信息,生成语音信号的频域的高频 带成分;第1~第N低频带时间包络计算单元,它们对由频率变换单元变换到频域的 低频带信号进行分析,取得多个低频带的时间包络,其中N为2以上的整数;时间 包络计算单元,其使用编码序列解码逆量化单元取得的时间包络信息、以及低频带时 间包络计算单元取得的多个低频带的时间包络,计算高频带的时间包络;频率包络计 算单元,其使用编码序列解码逆量化单元取得的频率包络信息,计算频率包络;时间 频率包络调整单元,其使用时间包络计算单元取得的时间包络、以及频率包络计算单 元取得的频率包络,调整高频带生成单元生成的高频带成分的时间包络和频率包络; 逆频率变换单元,其将时间频率包络调整单元调整后的高频带成分与低频带解码单元 解码出的低频带信号相加,输出包含整个频带成分的时域信号。

本发明的一个方面的解码方法是对编码序列进行解码的语音解码方法,该编码序 列是对语音信号进行编码而得到的,该语音解码方法包括:解复用步骤,解复用单元 将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码步骤,低频带解 码单元对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信号;频 率变换步骤,频率变换单元将低频带解码单元得到的低频带信号变换到频域;高频带 编码序列解析步骤,高频带编码序列解析单元对由解复用单元解复用得到的高频带编 码序列进行解析,取得编码后的高频带生成用辅助信息以及时间包络信息;编码序列 解码逆量化步骤,编码序列解码逆量化单元对由高频带编码序列解析单元取得的高频 带生成用辅助信息以及时间包络信息进行解码和逆量化;高频带生成步骤,高频带生 成单元根据由频率变换单元变换到频域的低频带信号,使用由编码序列解码逆量化单 元解码后的高频带生成用辅助信息,生成语音信号的频域的高频带成分;第1~第N 低频带时间包络计算步骤,第1~第N低频带时间包络计算单元对频率变换单元变换 到频域的低频带信号进行分析,取得多个低频带的时间包络,其中N为2以上的整 数;时间包络计算步骤,时间包络计算单元使用编码序列解码逆量化单元取得的时间 包络信息、以及低频带时间包络计算单元取得的多个低频带的时间包络,计算高频带 的时间包络;时间包络调整步骤,时间包络调整单元使用由时间包络计算单元取得的 时间包络,调整由高频带生成单元生成的高频带成分的时间包络;以及逆频率变换步 骤,逆频率变换单元将时间包络调整单元调整后的高频带成分与低频带解码单元解码 出的低频带信号相加,输出包含整个频带成分的时域信号。

或者,本发明的另一方面的解码方法是对编码序列进行解码的语音解码方法,该 编码序列是对语音信号进行编码而得到的,该解码方法包括:解复用步骤,解复用单 元将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码步骤,低频带 解码单元对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信号; 频率变换步骤,频率变换单元将低频带解码单元得到的低频带信号变换到频域;高频 带编码序列解析步骤,高频带编码序列解析单元对由解复用单元解复用得到的高频带 编码序列进行解析,取得编码后的高频带生成用辅助信息、频率包络信息以及时间包 络信息;编码序列解码逆量化步骤,编码序列解码逆量化单元对由高频带编码序列解 析单元取得的高频带生成用辅助信息、频率包络信息以及时间包络信息进行解码和逆 量化;高频带生成步骤,高频带生成单元根据由频率变换单元变换到频域的低频带信 号,使用由编码序列解码逆量化单元解码后的高频带生成用辅助信息,生成语音信号 的频域的高频带成分;第1~第N低频带时间包络计算步骤,第1~第N低频带时间 包络计算单元对由频率变换单元变换到频域的低频带信号进行分析,取得多个低频带 的时间包络,其中N为2以上的整数;时间包络计算步骤,时间包络计算单元使用 编码序列解码逆量化单元取得的时间包络信息、以及低频带时间包络计算单元取得的 多个低频带的时间包络,计算高频带的时间包络;频率包络叠加步骤,频率包络叠加 单元将由编码序列解码逆量化单元取得的频率包络信息叠加在高频带的时间包络中, 取得时间频率包络;时间频率包络调整步骤,时间频率包络调整单元使用由时间包络 计算单元取得的时间包络以及由频率包络叠加单元取得的时间频率包络,调整由高频 带生成单元生成的高频带成分的时间包络和频率包络;以及逆频率变换步骤,逆频率 变换单元将时间频率包络调整单元调整后的高频带成分与低频带解码单元解码出的 低频带信号相加,输出包含整个频带成分的时域信号。

或者,本发明的另一方面的解码方法是对编码序列进行解码的语音解码方法,该 编码序列是对语音信号进行编码而得到的,该语音解码方法包括:解复用步骤,解复 用单元将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码步骤,低 频带解码单元对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信 号;频率变换步骤,频率变换单元将低频带解码单元得到的低频带信号变换到频域; 高频带编码序列解析步骤,高频带编码序列解析单元对由解复用单元解复用得到的高 频带编码序列进行解析,取得编码后的高频带生成用辅助信息、频率包络信息以及时 间包络信息;编码序列解码逆量化步骤,编码序列解码逆量化单元对由高频带编码序 列解析单元取得的高频带生成用辅助信息、频率包络信息以及时间包络信息进行解码 和逆量化;高频带生成步骤,高频带生成单元根据由频率变换单元变换到频域的低频 带信号,使用由编码序列解码逆量化单元解码后的高频带生成用辅助信息,生成语音 信号的频域的高频带成分;第1~第N低频带时间包络计算步骤,低频带时间包络计 算单元对由频率变换单元变换到频域的低频带信号进行分析,取得多个低频带的时间 包络,其中N为2以上的整数;时间包络计算步骤,时间包络计算单元使用编码序 列解码逆量化单元取得的时间包络信息、以及低频带时间包络计算单元取得的多个低 频带的时间包络,计算高频带的时间包络;频率包络计算步骤,频率包络计算单元使 用编码序列解码逆量化单元取得的频率包络信息,计算频率包络;时间频率包络调整 步骤,时间频率包络调整单元使用时间包络计算单元取得的时间包络、以及频率包络 计算单元取得的频率包络,调整高频带生成单元生成的高频带成分的时间包络和频率 包络;逆频率变换步骤,逆频率变换单元将时间频率包络调整单元调整后的高频带成 分与低频带解码单元解码出的低频带信号相加,输出包含整个频带成分的时域信号。

本发明的一侧面的解码程序是对编码序列进行解码的语音解码程序,该编码序列 是对语音信号进行编码而得到的,该语音解码程序使计算机作为以下单元发挥作用: 解复用单元,其将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码 单元,其对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信号; 频率变换单元,其将低频带解码单元得到的低频带信号变换到频域;高频带编码序列 解析单元,其对由解复用单元解复用的高频带编码序列进行解析,取得编码后的高频 带生成用辅助信息以及时间包络信息;编码序列解码逆量化单元,其对由高频带编码 序列解析单元取得的高频带生成用辅助信息以及时间包络信息进行解码和逆量化;高 频带生成单元,其根据由频率变换单元变换到频域的低频带信号,使用由编码序列解 码逆量化单元解码后的高频带生成用辅助信息,生成语音信号的频域的高频带成分; 第1~第N低频带时间包络计算单元,它们对由频率变换单元变换到频域的低频带信 号进行分析,取得多个低频带的时间包络,其中N为2以上的整数;时间包络计算 单元,其使用编码序列解码逆量化单元取得的时间包络信息、以及低频带时间包络计 算单元取得的多个低频带的时间包络,计算高频带的时间包络;时间包络调整单元, 其使用由时间包络计算单元取得的时间包络,调整由高频带生成单元生成的高频带成 分的时间包络;以及逆频率变换单元,其将时间包络调整单元调整后的高频带成分与 低频带解码单元解码出的低频带信号相加,输出包含整个频带成分的时域信号。

本发明的一侧面的解码程序是对编码序列进行解码的语音解码程序,该编码序列 是对语音信号进行编码而得到的,该语音解码程序使计算机作为以下单元发挥作用: 解复用单元,其将编码序列解复用为低频带编码序列和高频带编码序列;低频带解码 单元,其对由解复用单元解复用得到的低频带编码序列进行解码,得到低频带信号; 频率变换单元,其将低频带解码单元得到的低频带信号变换到频域;高频带编码序列 解析单元,其对由解复用单元解复用得到的高频带编码序列进行解析,取得编码后的 高频带生成用辅助信息、频率包络信息以及时间包络信息;编码序列解码逆量化单元, 其对由高频带编码序列解析单元取得的高频带生成用辅助信息、频率包络信息以及时 间包络信息进行解码和逆量化;高频带生成单元,其根据由频率变换单元变换到频域 的低频带信号,使用由编码序列解码逆量化单元解码后的高频带生成用辅助信息,生 成语音信号的频域的高频带成分;第1~第N低频带时间包络计算单元,它们对由频 率变换单元变换到频域的低频带信号进行分析,取得多个低频带的时间包络,其中N 为2以上的整数;时间包络计算单元,其使用编码序列解码逆量化单元取得的时间包 络信息、以及低频带时间包络计算单元取得的多个低频带的时间包络,计算高频带的 时间包络;频率包络叠加单元,其将由编码序列解码逆量化单元取得的频率包络信息 叠加在高频带的时间包络中,取得时间频率包络;时间频率包络调整单元,其使用由 时间包络计算单元取得的时间包络以及由频率包络叠加单元取得的时间频率包络,调 整由高频带生成单元生成的高频带成分的时间包络和频率包络;以及逆频率变换单 元,其将时间频率包络调整单元调整后的高频带成分与低频带解码单元解码出的低频 带信号相加,输出包含整个频带成分的时域信号。

或者,本发明的另一侧面的解码程序是对编码序列进行解码的语音解码程序,该 编码序列是对语音信号进行编码而得到的,该语音解码程序使计算机作为以下单元发 挥作用:解复用单元,其将编码序列解复用为低频带编码序列和高频带编码序列;低 频带解码单元,其对由解复用单元解复用得到的低频带编码序列进行解码,得到低频 带信号;频率变换单元,其将低频带解码单元得到的低频带信号变换到频域;高频带 编码序列解析单元,其对由解复用单元解复用得到的高频带编码序列进行解析,取得 编码后的高频带生成用辅助信息、频率包络信息以及时间包络信息;编码序列解码逆 量化单元,其对由高频带编码序列解析单元取得的高频带生成用辅助信息、频率包络 信息以及时间包络信息进行解码和逆量化;高频带生成单元,其根据由频率变换单元 变换到频域的低频带信号,使用由编码序列解码逆量化单元解码后的高频带生成用辅 助信息,生成语音信号的频域的高频带成分;第1~第N低频带时间包络计算单元, 它们对由频率变换单元变换到频域的低频带信号进行分析,取得多个低频带的时间包 络,其中N为2以上的整数;时间包络计算单元,其使用编码序列解码逆量化单元 取得的时间包络信息、以及低频带时间包络计算单元取得的多个低频带的时间包络, 计算高频带的时间包络;频率包络计算单元,其使用编码序列解码逆量化单元取得的 频率包络信息,计算频率包络;时间频率包络调整单元,其使用时间包络计算单元取 得的时间包络、以及频率包络计算单元取得的频率包络,调整高频带生成单元生成的 高频带成分的时间包络和频率包络;以及逆频率变换单元,其将时间频率包络调整单 元调整后的高频带成分与低频带解码单元解码出的低频带信号相加,输出包含整个频 带成分的时域信号。

通过这样的解码装置、解码方法、或解码程序,根据编码序列进行解复用以及解 码,得到低频带信号,根据编码序列进行解复用、解码、以及逆量化得到高频带生成 用辅助信息以及时间包络信息。然后,根据使用高频带生成用辅助信息而变换到频域 的低频带信号生成频域高频带成分,另一方面,对频域的低频带信号进行分析,取得 多个低频带时间包络,然后,使用该多个低频带时间包络和时间包络信息,计算高频 带的时间包络。进而,利用算出的高频带时间包络调整高频带成分的时间包络,将调 整后的高频带成分与低频带信号相加,输出时域信号。这样,将多个低频带时间包络 用于调整高频带成分的时间包络,因此,利用低频带成分的时间包络和高频带成分的 时间包络的相关,以较高的精度调整高频带成分的时间包络的波形。其结果,能够将 解码信号中的时间包络调整为失真较少的形状,得到充分改善了前回声和后回声的再 现信号。

此处,优选的是,还具有时间包络计算控制单元,该时间包络计算控制单元使用 由所述频率变换单元变换到频域的所述低频带信号,控制所述第1~第N低频带时间 包络计算单元中的低频带的时间包络的计算、以及所述时间包络计算单元中的高频带 的时间包络的计算中的至少1个。如果具有这种时间包络计算控制单元,则能够根据 低频带信号的功率等性质省略低频带时间包络的计算、或高频带时间包络的计算的处 理,减少运算量。

另外,优选的是,还具有时间包络计算控制单元,该时间包络计算控制单元使用 由所述编码序列解码逆量化单元取得的所述时间包络信息,控制所述第1~第N低频 带时间包络计算单元中的低频带的时间包络的计算、以及所述时间包络计算单元中的 高频带的时间包络的计算中的至少1个。如果具有这种时间包络计算控制单元,则能 够根据基于编码序列得到的时间包络信息省略低频带时间包络的计算、或高频带时间 包络的计算的处理,减少运算量。

而且,优选的是,所述高频带编码序列解析单元还取得时间包络计算控制信息, 还具有时间包络计算控制单元,该时间包络计算控制单元使用由所述高频带编码序列 解析单元取得的时间包络计算控制信息,控制所述第1~第N低频带时间包络计算单 元中的低频带的时间包络的计算以及所述时间包络计算单元中的高频带的时间包络 的计算中的至少1个。如果采用这种结构,则能够根据基于编码序列得到的时间包络 计算控制信息省略低频带时间包络的计算、或高频带时间包络的计算的处理,减少运 算量。

另外,优选的是,所述高频带编码序列解析单元还取得时间包络计算控制信息, 所述编码序列解码/逆量化单元还取得第2频率包络信息,该语音解码装置还具有时 间包络计算控制单元,该时间包络计算控制单元根据所述时间包络计算控制信息,判 断是否基于所述第2频率包络信息调整高频带成分的频率包络,在判断为调整该频率 包络的情况下,控制为不进行所述第1~第N低频带时间包络计算单元中的低频带的 时间包络的计算、以及所述时间包络计算单元中的高频带的时间包络的计算。该情况 下,能够根据基于编码序列得到的时间包络计算控制信息,省略低频带时间包络的计 算、或高频带时间包络的计算的处理,减少运算量。

另外,优选的是,时间频率包络调整单元根据规定的函数对所述高频带生成单元 生成的语音信号的高频带成分进行处理。另外,优选的是,低频带时间包络计算单元 根据规定的函数对取得的多个低频带的时间包络进行处理。

另外,本发明的一个方面的编码装置是对语音信号进行编码的语音编码装置,该 语音编码装置具有:频率变换单元,其将所述语音信号变换到频域;下采样单元,其 对所述语音信号进行下采样,取得低频带信号;低频带编码单元,其对所述下采样单 元取得的低频带信号进行编码;第1~第N低频带时间包络计算单元,它们计算多个 由所述频率变换单元变换到频域的所述语音信号的低频带成分的时间包络,其中N 为2以上的整数;时间包络信息计算单元,其使用由所述第1~第N低频带时间包络 计算单元计算的低频带成分的所述时间包络,计算取得由所述频率变换单元变换后的 所述语音信号的高频带成分的时间包络所需的时间包络信息;辅助信息计算单元,其 对所述语音信号进行分析,计算用于根据低频带信号生成高频带成分的高频带生成用 辅助信息;量化编码单元,其对由所述辅助信息计算单元生成的所述高频带生成用辅 助信息、以及所述时间包络信息计算单元计算的所述时间包络信息进行量化和编码; 编码序列构成单元,其使由所述量化编码单元量化和编码后的所述高频带生成用辅助 信息以及所述时间包络信息构成为高频带编码序列;复用单元,其生成所述低频带编 码单元取得的所述低频带编码序列、所述编码序列构成单元构成的所述高频带编码序 列复用而得到的编码序列。

本发明的一个侧面的编码方法是对语音信号进行编码的编码方法,该语音编码方 法包括:频率变换步骤,频率变换单元将所述语音信号变换到频域;下采样步骤,下 采样对所述语音信号进行下采样,取得低频带信号;低频带编码步骤,低频带编码单 元对所述下采样单元取得的低频带信号进行编码;第1~第N低频带时间包络计算步 骤,第1~第N低频带时间包络计算单元计算多个由所述频率变换单元变换到频域的 所述语音信号的低频带成分的时间包络,其中N为2以上的整数;时间包络信息计 算步骤,时间包络信息计算单元使用由所述第1~第N低频带时间包络计算单元计算 的低频带成分的所述时间包络,计算取得由所述频率变换单元变换后的所述语音信号 的高频带成分的时间包络所需的时间包络信息;辅助信息计算步骤,辅助信息计算单 元对所述语音信号进行分析,计算用于根据低频带信号生成高频带成分的高频带生成 用辅助信息;量化编码步骤,量化编码单元对由所述辅助信息计算单元生成的所述高 频带生成用辅助信息、以及所述时间包络信息计算单元计算的所述时间包络信息进行 量化和编码;编码序列构成步骤,编码序列构成单元使由所述量化编码单元量化和编 码后的所述高频带生成用辅助信息以及所述时间包络信息构成为高频带编码序列;以 及复用步骤,复用单元生成所述低频带编码单元取得的所述低频带编码序列、所述编 码序列构成单元构成的所述高频带编码序列复用而得到的编码序列。

本发明的一个方面的编码程序是对语音信号进行编码的语音编码程序,该编码程 序使计算机作为以下单元发挥作用:频率变换单元,其将所述语音信号变换到频域; 下采样单元,其对所述语音信号进行下采样,取得低频带信号;低频带编码单元,其 对所述下采样单元取得的低频带信号进行编码;第1~第N低频带时间包络计算单元, 它们计算多个由所述频率变换单元变换到频域的所述语音信号的低频带成分的时间 包络,其中N为2以上的整数;时间包络信息计算单元,其使用由所述第1~第N 低频带时间包络计算单元计算的低频带成分的所述时间包络,计算取得由所述频率变 换单元变换后的所述语音信号的高频带成分的时间包络所需的时间包络信息;辅助信 息计算单元,其对所述语音信号进行分析,计算用于根据低频带信号生成高频带成分 的高频带生成用辅助信息;量化编码单元,其对由所述辅助信息计算单元生成的所述 高频带生成用辅助信息、以及所述时间包络信息计算单元计算的所述时间包络信息进 行量化和编码;编码序列构成单元,其使由所述量化编码单元量化和编码后的所述高 频带生成用辅助信息以及所述时间包络信息构成为高频带编码序列;复用单元,其生 成所述低频带编码单元取得的所述低频带编码序列、所述编码序列构成单元构成的所 述高频带编码序列复用而得到的编码序列。

通过这样的编码装置、编码方法、或编码程序,对语音信号进行下采样,得到低 频带信号,对该低频带信号进行编码,另一方面,根据频域语音信号计算多个低频带 成分时间包络,使用该多个低频带成分时间包络计算用于取得高频带成分时间包络的 时间包络信息。而且,计算用于根据低频带信号生成高频带成分的高频带生成用辅助 信息,对高频带生成用辅助信息和时间包络信息进行量化以及编码,然后,构成包含 高频带生成用辅助信息和时间包络信息的高频带编码序列。然后,生成低频带编码序 列以及高频带编码序列复用而得到的编码序列。由此,在向解码装置输入编码序列时, 能够在解码装置侧将多个低频带时间包络用于调整高频带成分的时间包络,能够在解 码装置侧利用低频带成分的时间包络与高频带成分的时间包络的相关,以较高的精度 调整高频带成分时间包络的波形。其结果,能够将解码信号中的时间包络调整为失真 较少的形状,在解码装置侧得到充分改善了前回声和后回声的再现信号。

此处,优选的是,还具有频率包络计算单元,该频率包络计算单元计算所述频率 变换单元变换到频域的所述语音信号的高频带成分的频率包络信息,所述量化编码单 元还对所述频率包络信息进行量化和编码,所述编码序列构成单元还附加由所述量化 编码单元量化和编码的所述频率包络信息而构成高频带编码序列。如果采用这种结 构,则能够在解码装置侧调整高频带成分的频率包络,所以能够在解码装置侧得到改 善了频率特性的再现信号。

另外,优选的是,还具有控制信息生成单元,该控制信息生成单元使用所述频率 变换单元变换到频域的所述语音信号、所述时间包络信息计算单元计算出的时间包络 信息中的至少1个,生成控制语音解码装置中的时间包络计算的时间包络计算控制信 息,所述编码序列构成单元还附加由所述控制信息生成单元生成的所述时间包络计算 控制信息而构成高频带编码序列。该情况下,能够参照语音信号的功率等性质、时间 包络信息使解码装置侧的时间包络计算处理高效化,能够减少运算量。

另外,优选的是,时间包络信息计算单元计算所述频率变换单元变换到频域的所 述语音信号的高频带成分的时间包络,基于根据所述第1~第N低频带成分的时间包 络算出的时间包络、与上述频带成分的时间包络的相关,计算时间包络信息。

发明效果

根据本发明,通过将解码信号中的时间包络调整为失真较少的形状,能够得到充 分改善了前回声和后回声的再现信号。

附图说明

图1是本发明的第1实施方式的语音解码装置1的概要结构图。

图2是示出通过图1的语音解码装置1实现的语音解码方法的步骤的流程图。

图3是本发明的第1实施方式的语音编码装置2的概要结构图。

图4是示出通过图3的语音编码装置2实现的语音编码方法的步骤的流程图。

图5是示出与第1实施方式的语音解码装置1的第1变形例中的包络计算有关的 主要部分的结构的图。

图6是示出图5的语音解码装置1的包络计算步骤的流程图。

图7是示出与第1实施方式的语音解码装置1的第2变形例中的包络计算有关的 主要部分的结构的图。

图8是示出图7的语音解码装置1的包络计算步骤的流程图。

图9是示出与第1实施方式的语音解码装置1的第3变形例中的包络计算有关的 主要部分的结构的图。

图10是示出图9的语音解码装置1的包络计算步骤的流程图。

图11是示出第1实施方式的语音解码装置1的第4变形例的包络计算步骤的流 程图。

图12是示出第1实施方式的语音解码装置1的第5变形例的包络计算步骤的流 程图。

图13是示出与第1实施方式的语音解码装置1的第6变形例中的包络计算相关 的主要部分的结构的图。

图14是示出第1实施方式的语音解码装置1的第7变形例中的时间包络计算部 1g的时间包络计算步骤的流程图。

图15是将第1实施方式的语音解码装置1的第7变形例应用于第1实施方式的 语音解码装置1的第2变形例时的时间包络计算控制部1m的处理的一部分的流程图。

图16是将第1实施方式的语音解码装置1的第7变形例应用于第1实施方式的 语音解码装置1的第4变形例时的时间包络计算控制部1n的处理的一部分的流程图。

图17是示出第1实施方式的语音编码装置2的第1变形例的结构的图。

图18是示出图17的语音编码装置2的语音编码步骤的流程图。

图19是示出第1实施方式的语音编码装置2的第2变形例的结构的图。

图20是示出图19的语音编码装置2的语音编码步骤的流程图。

图21是示出第1实施方式的语音编码装置2的第3变形例的结构的图。

图22是示出图21的语音编码装置2的语音编码步骤的流程图。

图23是示出第2实施方式的语音解码装置101的结构的图。

图24是示出图23的语音解码装置101的语音解码步骤的流程图。

图25是示出第2实施方式的语音编码装置102的结构的图。

图26是示出图25的语音编码装置102的语音编码步骤的流程图。

图27是示出将本发明第1实施方式的语音编码装置2的第1变形例应用于本发 明第2实施方式的语音编码装置102时的结构的图。

图28是图27的语音编码装置102的语音编码步骤的流程图。

图29是将本发明第1实施方式的语音编码装置2的第2变形例应用于本发明第 2实施方式的语音编码装置102时的结构的图。

图30是示出图29的语音编码装置102的语音编码步骤的流程图。

图31是示出第3实施方式的语音解码装置201的结构的图。

图32是示出图31的语音解码装置201的语音解码步骤的流程图。

图33是示出第4实施方式的语音解码装置301的结构的图。

图34是示出图33的语音解码装置301的语音解码步骤的流程图。

图35是示出第3实施方式的语音编码装置202的结构的图。

图36是示出图35的语音编码装置202的语音编码步骤的流程图。

图37是示出第4实施方式的语音编码装置302的结构的图。

图38是示出图37的语音编码装置302的语音编码步骤的流程图。

图39是示出第2实施方式的语音解码装置101的第3变化例的结构的图。

图40是示出图39的语音解码装置101的语音解码步骤的流程图。

具体实施方式

以下,详细说明附图、和本发明的语音解码装置、语音编码装置、语音解码方法、 语音编码方法、语音解码程序、以及语音编码程序的优选实施方式。在附图的说明中 对同一要素标注同一标号,省略重复的说明。

[第1实施方式]

图1是示出本发明的第1实施方式的语音解码装置1的结构的图,图2是示出通 过语音解码装置1实现的语音解码方法的步骤的流程图。语音解码装置1在物理上具 有未图示的CPU、ROM、RAM以及通信装置等,该CPU将存储在ROM等语音解 码装置1的内置存储器中的预定计算机程序(例如,用于进行图2的流程图所示的处 理的计算机程序)载入RAM并执行,由此对语音解码装置1进行统一控制。语音解 码装置1的通信装置接收从后述的语音编码装置2输出的已复用的编码序列,进而将 解码后的语音信号输出至外部。

如图1所示,语音解码装置1在功能上具有解复用部(解复用单元)1a、低频带 解码部(低频带解码单元)1b、频带分割滤波器组部(频率变换单元)1c、编码序列 解析部(高频带编码序列解析单元)1d、编码序列解码/逆量化部(编码序列解码逆 量化单元)1e、第1~第n(n为2以上的整数)低频带时间包络计算部(低频带时 间包络计算单元)1f1~1fn、时间包络计算部(时间包络计算单元)1g、高频带生成 部(高频带生成单元)1h、时间包络调整部(时间包络调整单元)1i、以及频带合成 滤波器组部(频率逆变换单元)1j(1c~1e、以及1h~1i有时也称为频带扩展部(频 带扩展单元)。)。图1所示的语音解码装置1的各功能部是语音解码装置1的CPU执 行存储在语音解码装置1的内置存储器中的计算机程序而实现的功能。语音解码装置 1的CPU通过执行该计算机程序(使用图1的各功能部)依次执行图2的流程图所 示的处理(步骤S01~步骤S10的处理)。假设执行该计算机程序所需的各种数据以 及通过执行该计算机程序而生成的各种数据都存储在语音解码装置1的ROM、RAM 等内置存储器中。

以下,详细说明语音解码装置1的各功能部的功能。

解复用部1a通过进行解复用将经由语音解码装置1的通信装置输入的已复用的 编码序列分离为低频带编码序列和高频带编码序列。

低频带解码部1b对从解复用部1a提供的低频带编码序列进行解码,得到仅包含 低频带成分的解码信号。此时,解码方式可以基于以CELP(Code-Excited Linear  Prediction)方式为代表的语音编码方式,也可以基于AAC(Advanced Audio Coding)、 TCX(Transform Coded Excitation)方式等的音频编码。另外,也可以基于PCM(Pulse  Code Modulation)编码方式。另外,也可以基于切换这些编码方式而进行编码的方式。 在本实施方式中不限定编码方式。

频带分割滤波器组部1c对从低频带解码部1提供的仅包含低频带成分的解码信 号进行分析,将该解码信号变换成频域的信号。以后,将由上述频带分割滤波器组部 1c取得的与低频带对应的频域信号表示为Xdec(j,i){0≤j<kx、t(s)≤i<t(s+1)、 0≤s<sE}。此处,j为频率方向的索引,i为时间方向的索引,kx为非负整数。另外, 将t定义为,与上述信号Xdec(j,i)的索引i相关的范围t(s)≤i<t(s+1)对应 于第s(0≤s<sE)个帧。另外,sE为所有帧的数量。上述帧例如与低频带解码部1b 的解码方式遵从的编码方式所规定的帧对应。另外,上述帧也可以与“ISO/IEC 14496-3”规定的“MPEG4 AAC”中利用的SBR中的所谓的SBR帧(SBR frame)、 或SBR包络时间段(SBR envelope time segment)对应。另外,在本实施方式中,上 述帧规定的时间间隔不限于上述例子。上述索引i也可以对应于“ISO/IEC 14496-3” 规定的“MPEG4 AAC”中利用的SBR中的QMF子带子样本(QMF subband  subsample)、或包含其的时隙(time slot)。

编码序列解析部1d对从解复用部1a提供的高频带编码序列进行解析,取得编码 后的高频带生成用辅助信息、以及编码后的时间/频率包络信息。

编码序列解码/逆量化部1e对从编码序列解析部1d提供的编码后的高频带生成 用辅助信息进行解码/逆量化,取得高频带生成用辅助信息,并且对从编码序列解析 部1d提供的编码后的时间包络信息进行解码/逆量化,取得时间包络信息。

第1~第n低频带时间包络计算部1f1~1fn分别计算不同的时间包络。即,第k 低频带时间包络计算部1fk(1≤k≤n)从频带分割滤波器组部1c取得低频带的信号 X(j,i){0≤j<kx、t(s)≤i<t(s+1)、0≤s<sE},计算低频带的第k个时间包 络Ldec(k,i)。(步骤Sb6的处理)。具体而言,第k低频带时间包络计算部1fk如下 这样计算时间包络Ldec(k,i)。

首先,可以使用满足下述条件的两个整数kl、kh来指定低频带内的不同副频带。

[式1]

0≤kl≤kh<kx

满足上述条件的可能的整数组(kl、kh)总共有nmax=kx(kx+1)/2个。只要选 择这些整数组内的任意一个,就能够指定上述副频带。

接着,通过从上述nmax个整数组中选择n个整数组,指定n个副频带。以下,为 了表示其中的n个频带,将两个大小为n的数组Bl、Bh定义为,信号Xdec(j,i){Bl(k)≤j≤Bh(k)、t(s)≤i<t(s+1)、0≤s<sE}与第k(1≤k≤n)个副频带成 分对应。

进而,利用下式得到上述n个副频带成分的功率的时间包络。

[式2]

EL(k,i)=1kh-kl+1Σj=klkh|Xdec(j,i)|2

kl=Bl(k),kh=Bh(k),

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

然后,以上述EL(k,i)为对象,计算出下式。

[式3]

L0(k,i)=10log10EL(k,i),

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

接着,对该量L0(k,i)实施规定的处理,得到时间包络L(k,i)。例如,也 可以使用下式,使该量L0(k,i)在时间方向平滑化,从而得到时间包络L(k,i)。

[式4]

L1(k,i)=Σj=0dL0(k,i-j)sc(j)diΣj=0iL0(k,i-j)sc(j)i<d

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

上述式中,sc(j)、0≤j≤d为平滑化系数,d为平滑化的次数。sc(j)例如可根 据下式设定,

[式5]

sc(j)=1/(d+1),0≤j≤d

但在本实施方式中,sc(j)的值不限于上式。

另外,上述L0(k,i)例如也可以利用下式来计算。

[式6]

L0(k,i)=EL(k,i),

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

进而,上述L0(k,i)例如可以利用下式来计算。

[式7]

L0(k,i)=10log10(EL(k,i)Σi=t(s)t(s+1)-1EL(k,i)+ϵ),

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

其中,ε是用于避免除以零的缓和系数。另外,上述L0(k,i)例如也可以利用 下式来计算。

[式8]

L0(k,i)=EL(k,i)Σi=t(s)t(s+1)-1EL(k,i)+ϵ,

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

并且,第k低频带时间包络计算部1fk计算的时间包络Ldec(k,i)例如可以使 用下式:

[式9]

Ldec(k,i)=L0(k,i)

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

或下式:

[式10]

Ldec(k,i)=L1(k,i)

1≤k≤n,t(s)≤i<t(s+1),0≤s<sE

1≤l,m≤n-1

而得到。

其中,上述Ldec(k,i)只要是表示第k个上述副频带的信号的信号功率或信号 振幅的时间变动的参数即可,不限于上述的L0(k,i)以及L1(k,i)的形式。

另外,上述Ldec(k,i)也可以利用如以下这样使用主成分分析的方法来计算。

首先,在上述Ldec(k,i){1≤k≤n、t(s)≤i≤t(s+1)、0≤s<sE}的计算过 程中,通过将上述n置换为其它整数m=n-1,针对索引k决定m种与上述Ldec(k, i)对应的量,重新将这些量表示为L2(k,i){1≤k≤m(=n-1)、t(s)≤i<t(s +1)、0≤s<sE}。然后,将与第s(0≤s<sE)个帧对应的上述L2(l,i){1≤l≤m、 t(s)≤i<t(s+1)}视为汇集了维数D=t(s+1)-t(s)的m个矢量的样本(sample), 利用下式求出这些样本的平均:

[式11]

L2,ave(i)=1mΣl=1mL2(l,i)

t(s)≤i<t(s+1),0≤s<sE

使用上述平均,利用下式定义变位矢量。

[式12]

δL2(l,i)=L2(l,i)-L2,ave(i)

1≤l≤m,

t(s)≤i<t(s+1),0≤s<sE

根据这些变位矢量,利用下式计算尺寸为D×D的方差-协方差矩阵Cov。

[式13]

Cov(i,j)=1mΣl=1mδL(l,i+t(s)-1)δL(l,j+t(s)-1)

i,j=1,2,…,D

0≤s<sE

接着,计算满足下式:

[式14]

Σj=1DCov(i,j)V(k)j=V(k)iλ(k)

i,k=1,2,…,D

的彼此正交的矩阵Cov的固有矢量V(k)。这里,上述V(k)i是固有矢量V(k)的 成分,λ(k)是与V(k)对应的矩阵Cov的固有值。这里,也可以对各个上述矢量V(k)进行归一化。其中,在本发明中,归一化的方法不作限定。以后,为了表述方便,设 λ(1)≥λ(2)≥···≥λ(D)

低频带时间包络计算部1fk(其中,1≤k≤n)使用以上取得的固有矢量如以下这 样计算时间包络Ldec(k,i)。即,如果D≥m(=n-1),则按照对应的固有值从大 到小的顺序从上述固有矢量中选择n-1个,通过下式计算。

[式15]

Ldec(k,i)=V(k)i1kn-1L2,ave(i)k=n

t(s)≤i<t(s+1),0≤s<sE

另一方面,如果D<m(=n-1),则使用上述固有矢量,通过下式计算。

[式16]

Ldec(k,i)=V(k)i1kDαD+1kn-1L2,ave(i)k=n

t(s)≤i<t(s+1),0≤s<sE

此处,α为常数,例如,可以设为α=0。另外,同样地,在D<m(=n-1)的 情况下,也可以通过下式来计算。

Ldec(k,i)=V(k)i1kDL2(k-D,i)D+1kn-1L2,ave(i)k=n

t(s)≤i<t(s+1),0≤s<sE

另外,上述Ldec(k,i)也可以通过以下方法计算。首先,在上述L2(l,i)的 计算过程中,设m=n,计算L2(l,i)、1≤l≤m、t(s)≤i<t(s+1)、0≤s<sE。 这可以视为汇集了n个维数D=t(s+1)-t(s)的矢量的集合。使用上述n个矢量, 通过格拉姆-施密特(Gram-Schmidt)正交法等方法计算n个正交矢量。将它们作 为Ldec(k,i)、1≤l≤n、t(s)≤i<t(s+1)、0≤s<sE。但是,正交化的方法不 限于上述例子。另外,正交矢量也可以不进行归一化。

时间包络计算部1g使用从第1~第n低频带时间包络计算部1f1~1fn提供的n 个低频带的时间包络、和从编码序列解码/逆量化部1e提供的时间包络信息,计算高 频带的时间包络。详细地讲,时间包络计算部1g如以下这样进行时间包络计算。

首先,将高频带分割为nH(nH≥1)个副频带,将这些副频带记为B(T)l(l=1,2, 3,···,nH)。接着,使用上述时间包络Ldec(k,i)计算高频带的副频带B(T)l的 时间包络gdec(l,i)。i为时间方向的索引。

例如,上述gdec(l,i)由下式给出。

[式18]

gdec(l,i)=Σk=1nAl,k(s)·Ldec(k,i),

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

此处,上述式中示出的值:

[式19]

Al,k(s),1≤l≤nH,1≤k≤m,0≤s<sE

是从编码序列解码/逆量化部1e提供的时间包络信息。

另外,从编码序列解码/逆量化部1e提供的时间包络信息的系数Al,k(s)可以包 含系数:

[式20]

Al,0(s),1≤l≤nH,0≤s<sE

在该情况下,上述gdec(l,i)由下式:

[式21]

gdec(l,i)=Σk=1n(Al,k(s)·Ldec(k,i))+Al,0(s)

1≤l≤nH,t9s)≤i<t(s+1),0≤s<sE

给出。

进而,从编码序列解码/逆量化部1e提供的时间包络信息除了上述系数Al,k(s) {1≤l≤nH、1≤k≤n、0≤s<sE}、或上述系数Al,k(s){1≤l≤nH、0≤k≤n、0≤s <sE}以外,还可以包含由下式:

[式22]

Al,-k(s),1≤l≤nH,1≤k≤g,0≤s<sE

给出的系数,在该情况下,上述gdec(l,i)也可以由下式:

[式23]

gdec(l,i)=Σk=1n(Al,k(s)·Ldec(k,i))+Σk=1g(Al,-k(s)·U(k,i))

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

或下式:

[式24]

gdec(l,i)=Σk=1n(Al,k(s)·Ldec(k,i))+Al,0(s)Σk=1g(Al,-k(s)·U(k,i))

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

给出。这里,U(k,i){1≤k≤g、t(s)≤i<t(s+1)、0≤s<sE}是规定的系 数或规定的函数。例如,上述U(k,i)也可以是由下式给出的函数。

[式25]

U(k,i)=cos(Ω·k·(i-t(s)))

1≤k≤g,t(s)≤i<t(s+1),0≤s<sE

此处,Ω为规定的系数。

此处,上述gdec(l、i)只要是基于Ldec(k,i)的表现,则也允许其它形式,时 间包络信息的形式也不限于系数Al,k(s)的形式。

最后,时间包络计算部1g使用上述gdec(l,i),通过下式:

[式26]

ET(l,i)=100.1×gdec(l,i),

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

或下式:

[式27]

ET,(l,i)=gdec(l,i),

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

计算时间包络。

高频带生成部1h使用从编码序列解码/逆量化部1e提供的高频带生成用辅助信 息将从频带分割滤波器组部1c提供的低频带的信号Xdec(j,i){0≤j<kx、t(s)≤ i<t(s+1)、0≤s<sE}复写到高频带,从而生成高频带的信号Xdec(j,i){kx≤j≤ kmax、t(s)≤i<t(s+1)、0≤s<sE}。上述高频带是按照“ISO/IEC 14496-3”规定 的“MPEG4 AAC”的SBR中的HF生成(HF generation)方法来生成的(“ISO/IEC 14496-3 subpart 4 General Audio Coding”)。

时间包络调整部1i使用从时间包络计算部1g提供的时间包络ET(l,i){1≤l ≤nH、t(s)≤i<t(s+1)、0≤s<sE}调整从高频带生成部1h提供的高频带信号 XH(j,i){kX≤j≤kmax、t(s)≤i<t(s+1)、0≤s<sE}的时间包络。

即,上述时间包络的调节是如以下这样由类似于“MPEG4 AAC”的SBR中的 HF调整(HF adjustment)的单元进行的。但是,为了简单起见,下面示出仅考虑了 HF调整中的噪声叠加(Noise addition)的方法,省略了其它的增益限制器(Gain  limiter)、增益平滑器(Gain smother)、与正弦波叠加(Sinusoid addition)等处理对应 的部分。但是,很容易以包含省略的上述处理的方式使处理一般化。假设为了进行与 噪声叠加对应的处理而所需的本底噪声·比例因子(Noise floor scale factor)、或进行 上述省略的处理时所需的参数已由编码序列解码/逆量化部1e提供。

首先,为了以下说明的简单起见,将以表示副频带B(T)l(1≤l≤nH)的边界的nH+1个索引为要素的数组FH定义为,信号XH(j,i){FH(l)≤j<FH(l+1)、t(s) ≤i<t(s+1)、0≤ssE}与副频带B(T)l的成分对应。其中,FH(1)=kx、FH(nH+1)=kmax+1。

根据上述定义,通过下式变换时间包络。

[式28]

E(m,i)=ET(l,i)

kl-kxmkh-kx,kl=FH(l)kh=FH(l+1)-1,

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

然后,通过下式变换由编码序列解码/逆量化部1e提供的噪声电平比例因子Q(m, i)。

[式29]

Q2(m,i)=E(m,i)·Q(m,i)1+Q(m,i),

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

其中,M=F(nH+1)-F(1)。另外,通过下式计算增益。

[式30]

G(m,i)=E(m,i)(ϵ+Hcurr(m,i))·Q(m,i)1+Q(m,i),

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

此处,定义由下式:

[式31]

Ecurr(k-kx,i)=1(kh-kl+1)·Σj=klkk|XH(j,i)|2,

klkkh,kl=FH(p)kh=FH(p+1)-1,

1≤p≤nH,t(s)≤i<t(s+1),0≤s<sE

表示的量。

最后,时间包络调整部1i通过下式得到已进行时间包络调节的信号。

[式32]

Re{Y(m+kx,i)}=Re{W1(m,i)}+Q2(m,i)·V0(f(i)),

Im{Y(m+kx,i)}=Im{W1(m,i)}+Q2(m,i)·V1(f(i)),

W1(m,i)=G(m,i)·Xdec(m+kx,i),

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

此处,V0、V1是规定噪声成分的数组,f是将索引i映射到上述数组的索引的函 数(具体例参见“ISO/IEC 14496-3 4.B.18”)。

频带合成滤波器组部1j在对从时间包络调整部1i提供的高频带信号Y(i,j){kx≤j≤kmax、t(s)≤i<t(s+1)、0≤s<sE}、从频带分割滤波器组部1c提供的低频带 信号X(j,i){0≤j<kx、t(s)≤i<t(s+1)、0≤s<sE}进行相加后进行频带合成, 由此,取得包含所有频带成分的时域的解码语音信号,经由内置的通信装置将取得的 语音信号输出到外部。

以下参照图2说明语音解码装置1的动作,并且,一并详细说明语音解码装置1 的语音解码方法。

首先,解复用部1a从输入的编码序列中分离出低频带编码序列和高频带编码序 列(步骤S01)。接着,低频带解码部1b对低频带编码序列进行解码,得到仅包含低 频带成分的解码信号(步骤S02)。然后,频带分割滤波器组部1c对仅包含低频带成 分的解码信号进行分析,变换为频域信号(步骤S03)。

进而,编码序列解析部1d对高频带编码序列进行解析,取得编码后的高频带生 成用辅助信息以及量化后的时间包络信息(步骤S04)。然后,编码序列解码/逆量化 部1e对高频频带生成用辅助信息进行解码,并且对时间包络信息进行逆量化(步骤 S05)。然后,高频带生成部1h使用高频带生成用辅助信息将低频带的信号Xdec(j, i)复写到高频带,由此生成高频带的信号Xdec(j,i)(步骤S06)。接着,第1~第n 低频带时间包络计算部1f1~1fn根据低频带的信号X(j,i),计算多个低频带的时间 包络Ldec(k,i)(步骤S07)。

进而,时间包络计算部1g使用多个低频带内的时间包络Ldec(k,i)和时间包络 信息,计算高频带的时间包络ET(l,i)(步骤S08)。然后,时间包络调整部1i使用 时间包络ET(l,i)调整高频带信号XH(j,i)的时间包络(步骤S09)。最后,频 带合成滤波器组部1j将高频带信号Y(i,j)和低频带信号X(j,i)相加后进行频 带合成,由此取得时域的解码语音信号,输出该解码语音信号(步骤S10)。

图3是示出本发明第1实施方式的语音编码装置2的结构的图,图4是示出由语 音编码装置2实现的语音编码方法的步骤的流程图。语音编码装置2具有在物理上未 图示的CPU、ROM、RAM以及通信装置等,该CPU将存储在ROM等的语音编码 装置2的内置存储器中的规定的计算机程序(例如用于进行图4的流程图所示的处理 的计算机程序)载入RAM并执行,由此统一地控制语音编码装置2。语音编码装置 2的通信装置从外部接收作为编码对象的语音信号,进而将编码后的复用比特流输出 到外部。

如图3所示,语音编码装置2在功能上具有:下采样部(下采样单元)2a、低频 带编码部(低频带编码单元)2b、频带分割滤波器组部(频率变换单元)2c、高频带 生成用辅助信息计算部(辅助信息计算单元)2d、第1~第n(n为2以上的整数) 低频带时间包络计算部(低频带时间包络计算单元)2e1~2en、时间包络信息计算部 (时间包络信息计算单元)2f、量化/编码部(量化编码单元)2g、高频带编码序列构 成部(编码序列构成单元)2h、以及复用部(复用单元)2i。图3所示的语音编码装 置2的各功能部是通过语音编码装置2的CPU执行存储在语音编码装置2的内置存 储器中的计算机程序而实现的功能。语音编码装置2的CPU通过执行该计算机程序 (使用图3所示的各功能部),依次执行图4的流程图所示的处理(步骤S11~步骤 S20的处理)。假设执行该计算机程序所需的各种数据以及通过执行该计算机程序而 生成的各种数据都存储在语音编码装置2的ROM、RAM等内置存储器中。

下采样部2a对经由语音编码装置2的通信装置接收到的来自外部的输入信号进 行处理,得到经过下采样的低频带的时域信号。低频带编码部2b对经过下采样的时 域信号进行编码,得到低频带编码序列。低频带编码部2b中的编码可以基于以CELP 方式为代表的语音编码方式,也可以基于以AAC为代表的变换编码或TCX方式等的 音频编码。另外,也可以基于PCM编码方式。另外,也可以基于切换这些编码方式 而进行编码的方式。在本实施方式中不限定编码方式。

频带分割滤波器组部2c对经由语音编码装置2的通信装置接收到的来自外部的 输入信号进行分析,变换为频域的所有频带的信号X(j,i)。其中,j为频率方向的 索引,i为时间方向的索引。

高频带生成用辅助信息计算部2d从频带分割滤波器组部2c接收频域的信号X(j, i),根据高频带的功率、信号变化、调性等的分析,计算在根据低频带信号成分生成 高频带信号成分时使用的高频带生成用辅助信息。

第1~第n低频带时间包络计算部2e1~2en分别计算多个不同的低频带成分的时 间包络。具体而言,第k低频带时间包络计算部2ek(1≤k≤n)从频带分割滤波器组 部2c接收低频带的信号X(j,i){0≤j<kX,(s)≤i<t(s+1),0≤s<sE},根据 上述的语音解码装置1的第k低频带时间包络计算部1fk(其中,1≤k≤n)的时间包 络Ldec(k,i)的计算方法,计算低频带的第k个时间包络L(k、i){t(s)≤i<t (s+1),0≤s<sE}。

时间包络信息计算部2f从频带分割滤波器组部2c接收高频带的信号X(j,i){kx≤j<N,t(s)≤i<t(s+1),0≤s<sE},另外,从第k低频带时间包络计算部2ek(1≤k≤n)接收时间包络L(k、i){t(s)≤i<t(s+1),0≤s<sE},计算取得信 号X(j,i)的高频带成分的时间包络所需的时间包络信息。上述时间包络信息是在 上述语音解码装置1侧提供上述时间包络Ldec(k,i)时能够恢复高频带的参照时间 包络的近似的信息。

具体而言,如以下这样进行上述时间包络信息的计算。首先,通过下式计算功率 的时间包络。

[式33]

EH(l,i)=1kh-kl+1Σj=klkh|X(j,i)|2

kh=FH(l),kl=FH(l+1)-1,

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

接着,如果将上述高频带的第l(1≤l≤nH)个频带的参照时间包络表示为H(l、 i){t(s)≤i<t(s+1)},则参照时间包络H(l、i)可通过下式:

[式34]

H(l,i)=10log10EH(l,i),

kh=FH(l),kl=FH(l+1)-1,

t(s)≤i<t(s+1),0≤s<sE

或下式:

[式35]

H(l,i)=EH(l,i),

kh=FH(l),kl=FH(l+1)-1,

t(s)≤i<t(s+1),0≤s<sE

计算。

另外,也可以与上述的低频带的时间包络同样地,对H(l,i)实施规定的处理 (例如平滑化),而成为高频带的参照时间包络。另外,高频带的参照时间包络只要 是表示高频带信号的信号功率或信号振幅的时间变动的参数即可,不限于上述计算方 法。将上述参照时间包络H(l,i)的上述时间包络L(k,i)的近似表示为g(l,i), 上述g(l,i)的方式依据语音解码装置1中的gdec(l,i)的方式。此处,使上述时 间包络L(k,i)与语音解码装置1侧的时间包络Ldec(k,i)对应。

例如,时间包络信息可通过定义上述g(l,i)相对于上述参照时间包络H(l,i) 的误差,求出使该误差最小的g(l,i)来计算。即,将误差作为时间包络信息的函 数,检索提供该误差的最小值的时间包络信息来计算即可。该时间包络信息的计算也 可以以数值的方式进行。另外,也可以使用公式进行计算。

更详细地讲,上述g(l,i)相对于参照时间包络H(l,i)的误差通过下式:

[式36]

error=Σi=t(s)t(s+1)-1(H(l,i)-g(l,i))2,

1≤l≤nH,0≤s<sE

来计算。另外,该误差也可以利用下式计算为权重误差。

[式37]

error=Σi=t(s)t(s+1)-1w(i)(H(l,i)-g(l,i))2,

1≤l≤nH,0≤s<sE

而且,误差也可以通过下式计算。

[式38]

error=Σl=1nHΣi=t(s)t(s+1)-1w(l,i)(H(l,i)-g(l,i))2,

0≤s<sE

此处,权重w(l,i)可以定义为根据时间索引i变化的权重,或者可以定义为 根据频率索引l变化的权重,也可以定义为根据时间索引i以及频率索引l变化的权 重。另外,在本实施方式中,不限于上述误差的形式以及上述例中的权重的形式。

量化/编码部2g从时间包络信息计算部2f接收时间包络信息,进行时间包络信息 的量化/编码,从高频带生成用辅助信息计算部2d接收高频带生成用辅助信息,对高 频带生成用辅助信息进行编码。

作为这样的时间包络信息的量化/编码方法,例如在该信息为系数Al,k(s)的形 式的情况下,也可以在对上述Al,k(s)进行标量量化后,进行熵编码。而且,也可以使 用规定的码本对Al,k(s)进行矢量量化,将其索引作为码元。另外,在本实施方式中, 时间包络信息的量化/编码方法不限于上述方法。

高频带编码序列构成部2h从量化/编码部2g接收编码后的高频带生成用辅助信 息和量化后的时间包络信息,构成包含这些信息的高频带编码序列。

复用部2i从低频带编码部2b接收低频带编码序列,从高频带编码序列构成部2h 接收高频带编码序列,对两个编码序列进行复用,从而生成编码序列,输出所生成的 编码序列。

以下,参照图4,说明语音编码装置2的动作,并且,一并详细说明语音编码装 置2中的语音编码方法。

首先,频带分割滤波器组部2c对所输入的语音信号进行分析,从而取得频域的 整个频带的信号X(j,i)(步骤S11)。接着,下采样部2a对来自外部的输入语音信 号进行处理,取得经过下采样的时域信号(步骤S12)。然后,低频带编码部2b对经 过下采样的时域信号进行编码,得到低频带编码序列(步骤S13)。

进而,高频带生成用辅助信息计算部2d对从频带分割滤波器组部2c取得的频域 信号X(j,i)进行分析,计算在生成高频带的信号成分时使用的高频带生成用辅助 信息(步骤S14)。然后,第1~第n低频带时间包络计算部2e1~2en根据低频带的信 号X(j,i),计算低频带的多个时间包络L(k、i)(步骤S15)。然后,时间包络信 息计算部2f根据高频带的信号X(j,i)、以及低频带的多个时间包络L(k、i),计 算取得信号X(j,i)的高频带成分的时间包络所需的时间包络信息(步骤S16)。接 着,量化/编码部2g对时间包络信息进行量化/编码,并且对高频带生成用辅助信息进 行编码(步骤S17)。

进而,高频带编码序列构成部2h构成包含编码后的高频带生成用辅助信息和量 化后的时间包络信息的高频带编码序列(步骤S18)。然后,复用部2i对低频带编码 序列和高频带编码序列进行复用,从而生成编码序列,输出所生成的编码序列(步骤 S19)。

根据以上说明的语音解码装置1、解码方法或解码程序,根据编码序列进行解复 用以及解码,得到低频带信号,根据编码序列进行解复用、解码、以及逆量化,得到 高频带生成用辅助信息以及时间包络信息。然后,使用高频带生成用辅助信息,根据 变换为频域的低频带信号Xdec(j,i)生成频域的高频带成分Xdec(j,i),另一方面, 对频域的低频带信号Xdec(j,i)进行分析,取得多个低频带的时间包络Ldec(k,i), 然后,使用该多个低频带的时间包络Ldec(k,i)、时间包络信息,计算高频带的时间 包络ET(l,i)。进而,通过计算出的高频带的时间包络ET(l,i)调整高频带成分 XH(j,i)的时间包络,将所调整的高频带成分与低频带信号相加,输出时域信号。 这样,将多个低频带的时间包络Ldec(k,i)用于调整高频带成分XH(j,i)的时间 包络,所以,利用低频带成分的时间包络和高频带成分的时间包络的相关,以较高的 精度调整高频带成分的时间包络波形。其结果,解码信号中的时间包络被调整为失真 较少的形状,能够得到前回声和后回声得到充分改善的再现信号。

另外,根据上述语音编码装置2、编码方法或编码程序,对语音信号进行下采样, 得到低频带信号,对该低频带信号进行编码,另一方面,根据频域的语音信号X(j, i),计算多个低频带成分的时间包络L(k,i),使用该多个低频带成分的时间包络L (k,i),计算用于取得高频带成分的时间包络的时间包络信息。进而,计算用于根 据低频带信号生成高频带成分的高频带生成用辅助信息,对高频带生成用辅助信息和 时间包络信息进行量化以及编码,然后,构成包含高频带生成用辅助信息和时间包络 信息的高频带编码序列。然后,生成对低频带编码序列以及高频带编码序列进行复用 而得到的编码序列。由此,在编码序列输入到语音解码装置1时,在语音解码装置1 侧能够将多个低频带的时间包络用于调整高频带成分的时间包络,在语音解码装置1 侧,利用低频带成分的时间包络和高频带成分的时间包络的相关,以较高的精度调整 高频带成分的时间包络的波形。其结果,解码信号中的时间包络被调整为失真较少的 形状,在解码装置侧能够得到前回声和后回声得到充分改善的再现信号。

[第1实施方式的语音解码装置的第1变形例]

图5是示出第1实施方式的语音解码装置1的第1变形例的包络计算的主要部分 的结构的图,图6是示出图5的语音解码装置1的包络计算的步骤的流程图。

除了低频带时间包络计算部1f1~1fn以及时间包络计算部1g以外,图5所示的 语音解码装置1还具有时间包络计算控制部(时间包络计算控制单元)1k。该时间包 络计算控制部1k从频带分割滤波器组部1c接收低频带信号,计算该帧中的低频带信 号的功率(步骤S31),将所计算出的低频带信号的功率与规定阈值比较(步骤S32)。 然后,在低频带信号的功率不大于规定阈值的情况下(步骤S32:否),时间包络计 算控制部1k向低频带时间包络计算部1f1~1fn输出低频带时间包络计算控制信号, 向时间包络计算部1g输出时间包络计算控制信号,进行控制,使得低频带时间包络 计算部1f1~1fn以及时间包络计算部1g不进行时间包络的计算处理。该情况下,高 频带信号的时间包络不根据上述时间包络进行调整(例如,上述式29中,设E(m, i)为Ecurr(m,i),取代上述式30,而采用下式:

[式39]

G(m,i)=Q(m,i)1+Q(m,i)

(步骤S36),而被发送到频带合成滤波器组部1j。另一方面,时间包络计算控 制部1k在低频带信号的功率大于规定的阈值的情况下,向低频带时间包络计算部 1f1~1fn输出低频带时间包络计算控制信号,向时间包络计算部1g输出时间包络计算 控制信号,进行控制,使得低频带时间包络计算部1f1~1fn以及时间包络计算部1g 实施时间包络的计算处理。该情况下,时间包络调整部1i根据上述时间包络而调整 时间包络后的高频带信号被发送到频带合成滤波器组部1j。

参照图6,在语音解码装置1的第1变形例中,将步骤S31~S36所示的包络计 算处理置换图2所示的第1实施方式的语音解码装置1的步骤S07~S09的处理并执 行。

根据这样的语音解码装置1的第1变形例,例如在低频带信号的功率较小、无法 用于计算高频带信号的时间包络的情况下,能够通过省略步骤S07~S08的处理来减 少运算量。

另外,时间包络计算控制部1k也可以计算与第1~第n低频带时间包络计算部 1f1~1fn计算的第1~第n低频带时间包络相当的部分的功率,也可以根据将相当于 算出的第1~第n低频带时间包络的功率与规定阈值进行比较而得的結果,输出低频 带时间包络计算控制信号,控制是否省略上述第1~第n低频带时间包络计算部1f1~ 1fn的处理。

该情况下,时间包络计算控制部1k在控制为省略所有第1~第n低频带时间包 络计算部1f1~1fn的处理的情况下,向时间包络计算部1g输出时间包络计算控制信 号,控制为省略时间包络计算处理控制。另外,时间包络计算控制部1k在第1~第n 低频带时间包络计算部1f1~1fn中的至少一个以上被控制为实施低频带时间包络的计 算处理的情况下,向时间包络计算部1g输出时间包络计算控制信号,控制为实施时 间包络计算处理。

[第1实施方式的语音解码装置的第2变形例]

图7是示出与第1实施方式的语音解码装置1的第2变形例中的包络计算相关的 主要部分的结构图,图8是示出图7的语音解码装置1的包络计算的步骤的流程图。

除了低频带时间包络计算部1f1~1fn以及时间包络计算部1g以外,图7所示的 语音解码装置1还具有时间包络计算控制部(时间包络计算控制单元)1m。该时间 包络计算控制部1m根据从编码序列解码/逆量化部1e接收到的时间包络信息,向第 1~第n低频带时间包络计算部1f1~1fn输出低频带时间包络计算控制信号,从而控 制第1~第n低频带时间包络计算部1f1~1fn中的低频带时间包络计算处理的实施。

详细地讲,在语音解码装置1的第2变形例中,用图8所示的步骤S41~S48的 包络计算处理置换图2所示的第1实施方式的语音解码装置1的步骤S07~S09的处 理并执行。

首先,时间包络计算控制部1m将计数值count设为0(步骤S41)。接着,时间 包络计算控制部1m判定从编码序列解码/逆量化部1e接收到的时间包络信息中包含 的系数Al,count+1(s)是否为0(步骤S42)。

在判定结果是系数Al,count+1(s)为0的情况下(步骤S42:否),时间包络计算 控制部1m向第count个低频带时间包络计算部1fcount输出低频带时间包络计算控制 信号,进行控制,使得不实施低频带时间包络计算部1fcount中的低频带时间包络计算 处理,而转移到步骤S44的处理。另一方面,在判定为系数Al,count+1(s)不是0的 情况下(步骤S42:是),向第count个低频带时间包络计算部1fcount输出低频带时间 包络计算控制信号,进行控制,使得实施低频带时间包络计算部1fcount中的低频带时 间包络计算处理。由此,低频带时间包络计算部1fcount计算低频带时间包络(步骤 S43)。

进而,时间包络计算控制部1m在计数值count增加1(步骤S44)后,比较计数 值count与低频带时间包络计算部1f1~1fn的个数n(步骤S45)。在比较的结果为计 数值count小于个数n的情况下(步骤S45:是),返回到步骤S42的处理,反复判定 时间包络信息中包含的下一个系数Al,count(s)。另一方面,在计数值count为个数n 以上的情况下(步骤S45:否),转移到步骤S46的处理。然后,时间包络计算控制 部1m判定1个以上的低频带时间包络计算部1f1~1fn是否实施了低频带时间包络的 计算处理(步骤S46)。在判定的结果为所有的低频带时间包络计算部1f1~1fn未实施 低频带时间包络的计算处理的情况下(步骤S46:否),向时间包络计算部1g输出时 间包络计算控制信号,控制为省略时间包络计算处理。该情况下,取代步骤S47~S48 的处理,而实施步骤S49,转移到步骤S10的处理(图2)。与此相对,在1个以上的 低频带时间包络计算部1f1~1fn实施了低频带时间包络的计算处理的情况下(步骤 S46:是),时间包络计算部1g实施时间包络的计算处理(步骤S47)。接着,时间包 络调整部1i实施高频带信号的时间包络调整处理(步骤S48)。然后,频带合成滤波 器组部1j实施输出信号的合成处理。

根据这样的语音解码装置1的第2变形例,在基于根据编码序列得到的时间包络 信息不需要一部分处理的情况下,通过省略步骤S07~S08的任意一个处理,能够减 少运算量。

[第1实施方式的语音解码装置的第3变形例]

图9是示出关于第1实施方式的语音解码装置1的第3变形例的包络计算有关的 主要部分的结构的图,图10是示出图9的语音解码装置1的包络计算步骤的流程图。

除了低频带时间包络计算部1f1~1fn以及时间包络计算部1g以外,图9所示的 语音解码装置1还具有时间包络计算控制部(时间包络计算控制单元)1n。该时间包 络计算控制部1n从编码序列解析部1d接收时间包络计算控制信息。在本变形例中, 时间包络计算控制信息记载了在该帧中是否实施时间包络计算处理。在读取时间包络 计算控制信息的记述内容时需要进行解码/逆量化处理的情况下,由编码序列解码/逆 量化部1e实施解码逆量化处理。另外,时间包络计算控制部1n通过参照时间包络计 算控制信息,决定在该帧中是否实施时间包络计算处理。而且,时间包络计算控制部 1n在决定为不实施时间包络计算处理的情况下,向低频带时间包络计算部1f1~1fn输出低频带时间包络计算控制信号,向时间包络计算部1g输出时间包络计算控制信 号,进行控制,使得低频带时间包络计算部1f1~1fn以及时间包络计算部1g不进行 时间包络的计算处理。该情况下,不根据上述时间包络调整高频带信号的时间包络, 而发送到频带合成滤波器组部1j。另一方面,时间包络计算控制部1n在决定实施时 间包络计算处理的情况下,向低频带时间包络计算部1f1~1fn输出低频带时间包络计 算控制信号,向时间包络计算部1g输出时间包络计算控制信号,进行控制,使得低 频带时间包络计算部1f1~1fn以及时间包络计算部1g进行时间包络的计算处理。该 情况下,由时间包络调整部1i调整了时间包络后的高频带信号被发送到频带合成滤 波器组部1j。

参照图10,在语音解码装置1的第3变形例中,将步骤S51~S54所示的包络计 算处理置换图2所示的第1实施方式的语音解码装置1的步骤S07~S09的处理并执 行。

根据这样的语音解码装置1的第3变形例,通过基于来自编码装置侧的控制信息 省略步骤S07~S08的处理,也能减少运算量。

[第1实施方式的语音解码装置的第4变形例]

图11是示出第1实施方式的语音解码装置1的第4变形例的包络计算步骤的流 程图。并且,该语音解码装置1的第4变形例的结构与图9所示的结构相同。

在该第4变形例中,用图11所示的步骤S61~S64示出的包络计算处理置换图2 所示的第1实施方式的语音解码装置1的步骤S07~S09的处理并执行。

即,在时间包络计算控制信息中记载了在该帧中第1~n低频带时间包络中的用 于时间包络计算处理的低频带时间包络。此处,在读取时间包络计算控制信息的记载 内容时需要解码/逆量化处理的情况下,编码序列解码/逆量化部1e实施解码逆量化处 理。然后,时间包络计算控制部1n根据时间包络计算控制信息选择在该帧中用于时 间包络计算处理的低频带时间包络(步骤S61)。

接着,时间包络计算控制部1n向第1~n低频带时间包络计算部1f1~1fn输出低 频带时间包络计算控制信号。由此,控制为与通过上述选择处理所选择低频带时间包 络相应的低频带时间包络计算部1f1~1fn计算低频带时间包络,并且控制为与未通过 上述选择处理选择的低频带时间包络相应的低频带时间包络计算部1f1~1fn不计算低 频带时间包络(步骤S62)。

然后,时间包络计算控制部1n向时间包络计算部1g输出时间包络计算控制信号, 控制为仅使用所选择的低频带时间包络来计算时间包络(步骤S63)。进而,时间包 络调整部1i使用所计算的时间包络调整高频带生成部1h生成的高频带信号的时间包 络(步骤S64)。

另外,在上述选择处理中未选择任意一个低频带时间包络的情况下,跳过上述步 骤S62~S63,不根据上述时间包络调整时间包络(图6的步骤S36),而将高频带信 号发送到频带合成滤波器组部1j。

这样的语音解码装置1的第4变形例中,也根据来自编码装置侧的控制信息省略 步骤S07~S08的处理,从而能够减少运算量。

[第1实施方式的语音解码装置的第5变形例]

图12是示出第1实施方式的语音解码装置1的第5变形例的包络计算步骤的流 程图。该语音解码装置1的第5变形例的结构与图9所示的结构相同。

在该第5变形例中,将图12所示的步骤S71~S75中示出的包络计算处理置换图 2所示的第1实施方式的语音解码装置1的步骤S07~S09的处理并执行。

即,在时间包络计算控制信息中,记载了在该帧中计算第1~n低频带时间包络 的方法。在读取时间包络计算控制信息的记载内容时需要解码/逆量化处理的情况下, 编码序列解码/逆量化部1e实施解码逆量化处理。记载在时间包络计算控制信息中的 第1~n低频带时间包络的计算方法例如可以是与表示副频带的数组Bl、Bh的设定相 关的内容,能够根据这样的时间包络计算控制信息来控制副频带的频率范围。关于与 数组Bl、Bh的设定相关的内容,可以记载设定数组Bl、Bh的整数的组(kl、kh),也 可以从规定的多个数组Bl、Bh的设定内容中选择任意一个。在本变形例中,与数组 Bl、Bh的设定相关的内容的记载方法没有限定。另外,关于记载在时间包络计算控制 信息中的第1~n低频带时间包络的计算方法,可以是与上述规定处理的设定相关的 内容(例如,与上述平滑化系数sc(j)的设定相关的内容),由此,能够根据时间包 络计算控制信息来控制上述规定处理(例如,上述平滑化处理)。关于与平滑化系数 sc(j)的设定相关的内容,可以是对平滑化系数sc(j)的值进行量化/编码,也可以 是从规定的多个平滑化系数sc(j)中选择任意一个。而且,也可以包含记载是否进 行平滑化处理的内容。在本变形例中,与上述规定处理的设定(例如,上述平滑化系 数sc(j)的设定)相关的内容的记载方法没有限定。并且,记载在时间包络计算控 制信息中的第1~n低频带时间包络的计算方法可以包含上述计算方法中的至少1个 以上。并且,在本变形例中,关于记载在时间包络计算控制信息中的第1~n低频带 时间包络的计算方法,只要记载了与低频带时间包络的计算方法相关的内容即可,而 不限于上述内容。

在步骤S71中,时间包络计算控制部1n根据时间包络计算控制信息来决定在该 帧中是否变更低频带时间包络的计算方法。接着,在不变更低频带时间包络的计算方 法的情况下(步骤S71:否),不变更低频带时间包络的计算方法,而由低频带时间 包络计算部1f1~1fn计算第1~n低频带时间包络(步骤S73)。另一方面,在变更低 频带时间包络的计算方法的情况下(步骤S71:是),时间包络计算控制部1n向低频 带时间包络计算部1f1~1fn输出低频带时间包络计算控制信号,指示低频带时间包络 的计算方法,变更低频带时间包络的计算方法(步骤S72)。然后,低频带时间包络 计算部1f1~1fn利用所变更的低频带时间包络计算方法,计算第1~n低频带时间包 络(步骤S73)。进而,时间包络计算部1g使用由低频带时间包络计算部1f1~1fn计 算的第1~n低频带时间包络来计算时间包络(步骤S74)。然后,时间包络调整部1i 使用由时间包络计算部1g计算出的时间包络,调整由高频带生成部1h生成的高频带 信号的时间包络(步骤S75)。

通过这样的语音解码装置1的第5变形例,根据来自编码装置侧的控制信息,详 细地控制步骤S07~S08的处理,由此能够进一步减少精度较高的时间包络的调整。

[第1实施方式的语音解码装置的第6变形例]

图13是示出与第1实施方式的语音解码装置1的第6变形例的包络计算相关的 主要部分的结构的图。除了低频带时间包络计算部1f1~1fn以及时间包络计算部1g 以外,图13所示的语音解码装置1还具有时间包络计算控制部(时间包络计算控制 单元)1o。该时间包络计算控制部1o构成为执行语音解码装置1的第1~第5变形 例中的包络计算处理中的任意一个以上。

[第1实施方式的语音解码装置的第7变形例]

图14是示出第1实施方式的语音解码装置1的第7变形例的包络计算步骤的流 程图。另外,该语音解码装置1的第7变形例的结构与第1实施方式的语音解码装置 1相同。图14的步骤S261~S262置换示出上述第1实施方式的语音解码装置1的处 理的流程图(图2)中的步骤S08。

在本变形例中,时间包络计算部1g使用从低频带时间包络计算部1f1~1fn提供 的低频带内的时间包络Ldec(k,i){1≤k≤n、t(s)≤i<t(s+1)、0≤s<sE}、从 编码序列解码/逆量化部1e提供的时间包络信息,在规定处理(步骤S261的处理) 之后,计算时间包络(步骤S262的处理)。此处,关于规定处理、以及与其相关的时 间包络计算,存在以下示出的例子。

在第1例中,使用从编码序列解码/逆量化部1e以其它形式提供的时间包络信息 计算式18、式21、式23、或式24中的系数Al,k(s)。例如,通过下式计算上述系 数。

[式40]

Alk(s)=Flk1(s),α2(s),…,αNum(s))

1≤l≤nH,1≤k≤n

0≤s<sE

此处,αk(s)、k=1,2,···,Num、0≤s<sE是从编码序列解码/逆量化部1e提供 的时间包络信息,Flk(X1,X2,···,XNum)、1≤l≤nH、1≤k≤n是以Num个变量为 引数的规定函数。然后,使用通过上述方法取得的系数Al,k(s),根据式18、式21、 式23、或式24计算时间包络。

在第2例中,首先,计算由下式给出的量。

[式41]

g(0)(l,i)=Σk=1n(A(0)l,k·Ldec(k,i))+A(0)l,0+Σk=1g(A(0)l,-k·U(k,i))

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

此处,下式:

[式42]

A(0)l,k,1≤l≤nH,-g≤k≤n

是规定的系数。

另外,上述g(0)(l,i)也可以是规定的系数,另外,也可以是与索引l,i相关 的规定函数。例如,上述g(0)(l,i)可以是由下式给出的函数。

[式43]

g(0)(l,i)=λlωi-t(s)

1≤l≤n,t(s)≤i<t(s+1),0≤s<sE

此处,λ、ω是规定的系数。

接着,计算与式18、式21、式23或式24的左边对应的量,将它们重新表示为 g(1)(l,i){1≤l≤nH、t(s)≤i<t(s+1)、0≤s<sE}。并且,时间包络例如通过 下式计算。

[式44]

gdec(l,i)=g(1)(l,i)+g(0)(l,i)

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

另外,时间包络也可以通过下式计算。

[式45]

gdec(l,i)=g(0)(l,i)·g(1)(l,i)

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

另外,还可以通过下式:

[式46]

gdec(l,i)=g(1)(l,i)

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

计算时间包络。

另外,在编码序列解码/逆量化部1e未提供时间包络信息的情况下,也可以通过 下式:

[式47]

gdec(l,i)=g(0)(l,i)

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

计算时间包络。

在本变形例中,上述gdec(l,i)的形式不限于上例。

另外,在本发明中,规定的处理以及与其相关的时间包络计算的内容不限于上例。

本变形例也可以通过以下方法应用于第1实施方式的语音解码装置1的第1~第 6变形例。

在应用于第1实施方式的语音解码装置1的第1变形例的情况下,例如用图14 的步骤S261~S262置换图6的步骤S34。此处,也可以预先准备多个上述规定的处 理,按照低频信号的功率的大小进行切换。并且,也可以按照低频信号的功率的大小 选择以下方法中的任意一个:a)仅实施上述规定的处理,计算时间包络,b)实施上述 规定的处理,进而使用时间包络信息,计算时间包络,c)不实施上述规定的处理,而 使用时间包络信息计算时间包络。

图15是示出应用于第1实施方式的语音解码装置1的第2变形例时的、第1实 施方式的语音解码装置1的第7变形例中的时间包络计算控制部1m的处理的一部分 的流程图。

在应用于第1实施方式的语音解码装置1的第2变形例的情况下,例如用图15 的步骤S271置换图8的步骤S42,用图14的步骤S261~S262置换图8的步骤S47。 另外,也可以预先准备多个规定的处理,根据时间包络信息进行切换。并且,也可以 根据时间包络信息选择以下方法中的任意一个:a)仅实施上述规定的处理,计算时间 包络,b)实施上述规定的处理,进而使用时间包络信息,计算时间包络,c)不实施上 述规定的处理,而使用时间包络信息计算时间包络。

另外,在应用于第1实施方式的语音解码装置1的第3变形例的情况下,例如用 图14的步骤S261~S262置换图10的步骤S53。另外,也可以预先准备多个规定的 处理,根据时间包络计算控制信息进行切换。并且,也可以根据时间包络计算控制信 息选择以下方法中的任意一个:a)仅实施上述规定的处理,计算时间包络,b)实施上 述规定的处理,进而使用时间包络信息,计算时间包络,c)不实施上述规定的处理, 而使用时间包络信息计算时间包络。

图16是示出应用于第1实施方式的语音解码装置1的第4变形例时的第1实施 方式的语音解码装置1的第7变形例中的时间包络计算控制部1n的处理的一部分的 流程图。

在应用于第1实施方式的语音解码装置1的第4变形例的情况下,用图16的步 骤S281置换图11的步骤S61,用图14的步骤S261~S262置换图11的步骤S63。 在图16的步骤S281中,作为选择根据第1~n低频带成分的时间包络计算的低频带 成分的时间包络的方法,例如可以是调查上述规定处理的一例中的A(0)l,k是否为零, 在A(0)l,k不是零、而且通过时间包络计算控制信息指示低频信号时间包络计算部1fk计算Ldec(k,i)的情况下,低频信号时间包络计算部1fk计算Ldec(k,i)。

在应用于第1实施方式的语音解码装置1的第5变形例的情况下,用图14的步 骤S261~S262置换图12的步骤S74。此处,在变更了低频带成分的时间包络计算方 法的情况下,也可以相应地变更规定的处理方法。

另外,按照应用于上述第1~第5变形例的方法,应用于第1实施方式的语音解 码装置1的第6变形例。

并且,在图14中,示出可在规定的处理后计算时间包络的流程,但也可以在计 算时间包络后进行规定的处理。例如,可以对已计算的时间包络实施平滑化等规定的 处理。而且,也可以在规定的处理之后,计算时间包络,进而对该时间包络实施其它 的规定处理。

[第1实施方式的语音编码装置的第1变形例]

图17是示出第1实施方式的语音编码装置2的第1变形例的结构的图,图18 是示出图17的语音编码装置2的语音编码步骤的流程图。

图17所示的语音编码装置2相对于第1实施方式的语音编码装置2,进一步追 加了时间包络计算控制信息生成部(控制信息生成单元)2j。

该时间包络计算控制信息生成部2j使用从频带分割滤波器组部2c接收的频域信 号X(j,i)、以及从时间包络信息计算部2f接收的时间包络信息中的至少1个以上, 生成时间包络计算控制信息。所生成的时间包络计算控制信息只要是第1实施方式的 语音解码装置1的第3~第7变形例中的时间包络计算控制信息中的任意一个即可。

此处,时间包络计算控制信息生成部2j例如计算与从频带分割滤波器组部2c接 收的频域信号X(j,i)中的低频带信号相应的频带的信号功率,根据所计算的信号 功率生成表示是否由语音解码装置1实施时间包络计算处理的时间包络计算控制信 息。

另外,时间包络计算控制信息生成部2j也可以计算与频域信号X(j,i)中的高 频带信号相应的频带的信号功率,根据所计算的信号功率生成表示是否由语音解码装 置1实施时间包络计算处理的时间包络计算控制信息。

而且,时间包络计算控制信息生成部2j还可以计算与频域信号X(j,i)中的整 个频带信号相应的频带(即,与低频带信号相应的频带和与高频信号相应的频带)的 信号功率,根据所计算的信号功率生成表示是否由解码装置实施时间包络计算处理的 时间包络计算控制信息。

进而,时间包络计算控制信息生成部2j计算与第1~第n低频带时间包络计算部 2e1~2en计算的第1~第n低频带时间包络相应的部分的功率,根据算出的信号功率, 生成与语音解码装置1在时间包络计算处理中使用的低频带时间包络的选择相关的 时间包络计算控制信息。

另外,时间包络计算控制信息生成部2j计算与频域信号X(j,i)中的低频带信 号相应的频带的信号功率,根据算出的信号功率,生成与语音解码装置1中的低频带 时间包络计算方法相关的时间包络计算控制信息。

在本变形例中,计算的信号功率的频带没有限定,根据算出的信号功率而生成的 时间包络计算控制信息只要是上述第1实施方式的语音解码装置1的第3~第7变形 例的时间包络计算控制信息中的任意一个以上即可。

进而,时间包络计算控制信息生成部2j检测/测定频域信号X(j,i)的信号特性, 根据信号特性,生成表示是否由语音解码装置1实施时间包络计算处理的时间包络计 算控制信息。

另外,时间包络计算控制信息生成部2j也可以根据频域信号X(j,i)的信号特 性,生成与语音解码装置1在时间包络计算处理中使用的低频带时间包络的选择相关 的时间包络计算控制信息。

而且,时间包络计算控制信息生成部2j也可以根据频域信号X(j,i)的信号特 性,生成与语音解码装置1中的低频带时间包络计算方法相关的时间包络计算控制信 息。

时间包络计算控制信息生成部2j检测/测定的信号特性可以是与信号的上升/下降 的陡峭程度相关的特性。而且,还可以是与信号的稳定性相关的特性。而且,也可以 是与信号的调性强度相关的特性。而且,也可以是上述特性中的至少1个以上。

在本变形例中,检测/测定的信号特性没有限定,根据检测/测定的信号特性而生 成的时间包络计算控制信息只要是第1实施方式的语音解码装置1的第3~第6变形 例的时间包络计算控制信息中的任意1个以上即可。

另外,时间包络计算控制信息生成部2j例如根据从时间包络信息计算部2f接收 的上述时间包络信息Al,k(s)(1≤l≤nH,1≤k≤n,0≤s<sE)的值生成表示是否由 语音解码装置1实施时间包络计算处理的时间包络计算控制信息。而且,时间包络计 算控制信息生成部2j也可以生成与语音解码装置1在时间包络计算处理中使用的低 频带时间包络的选择相关的时间包络计算控制信息。而且,也可以生成与语音解码装 置1中的低频带时间包络计算方法相关的时间包络计算控制信息。

在本变形例中,根据时间包络信息而生成的时间包络计算控制信息只要是第1 实施方式的语音解码装置1的第3~第6变形例的时间包络计算控制信息中的任意1 个以上即可。

另外,时间包络计算控制信息生成部2j例如也可以使用从频带分割滤波器组部 2c接收的频域信号X(j,i)、以及从量化/编码部2g接收的高频带生成用辅助信息的 编码序列,生成表示是否由语音解码装置1实施时间包络计算处理的时间包络计算控 制信息。而且,时间包络计算控制信息生成部2j也可以生成与语音解码装置1在时 间包络计算处理中使用的低频带时间包络的选择相关的时间包络计算控制信息。而 且,时间包络计算控制信息生成部2j也可以生成与语音解码装置1的低频带时间包 络计算方法相关的时间包络计算控制信息。

更具体地讲,时间包络计算控制信息生成部2j例如对从量化/编码部2g接收的高 频带生成用辅助信息的编码序列进行解码/逆量化,取得局部解码高频带生成用辅助 信息,然后,使用该局部解码高频带生成用辅助信息、以及频域信号X(j,i),生成 伪局部解码高频带信号。通过实施与第1实施方式的语音解码装置1的高频带生成部 1h相同的处理,能够生成伪局部解码高频带信号。比较所生成的伪局部解码高频带 信号、与对应于频域信号X(j,i)的高频带信号的频带,根据比较结果,生成时间 包络计算控制信息。

此处,关于伪局部解码高频带信号与对应于频域信号X(j,i)的高频带信号的 频带的比较,也可以计算这两个信号的差分信号,基于该差分信号的功率大小。而且, 也可以计算伪局部解码高频带信号与对应于频域信号X(j,i)的高频带信号的频带 的时间包络,基于该时间包络的差分、或差分大小中的至少1个。

另外,时间包络计算控制信息生成部2j例如也可以使用从频带分割滤波器组部 2c接收的频域信号X(j,i)、从时间包络信息计算部2f接收的时间包络信息、以及 从量化/编码部2g接收的高频带生成用辅助信息的编码序列,生成表示是否由语音解 码装置1实施时间包络计算处理的时间包络计算控制信息。而且,时间包络计算控制 信息生成部2j也可以生成与语音解码装置1在时间包络计算处理中使用的低频带时 间包络的选择相关的时间包络计算控制信息。而且,时间包络计算控制信息生成部 2j也可以生成与语音解码装置1的低频带时间包络计算方法相关的时间包络计算控 制信息。

更具体地讲,时间包络计算控制信息生成部2j在生成伪局部解码高频带信号后, 使用从时间包络信息计算部2f接收的时间包络信息,调整该伪局部解码高频带信号 的时间包络,比较调整该时间包络后的伪局部解码高频带信号与对应于频域信号X (j,i)的高频带信号的频带,基于比较结果,生成时间包络计算控制信息。

另外,关于调整时间包络后的伪局部解码高频带信号与相当于频域信号X(j,i) 的高频带信号的频带的比较,可以与伪局部解码高频带信号和相当于频域信号X(j, i)的高频带信号的频带的比较同样地实施。

另外,在第1实施方式的语音编码装置2的时间包络信息计算部2f中,也可以 使用伪局部解码高频带信号来计算时间包络信息。更具体地讲,向时间包络信息计算 部2f还输入从量化/编码部2g接收的高频带生成用辅助信息的编码序列,对该高频带 生成用辅助信息的编码序列进行解码/逆量化,取得局部解码高频带生成用辅助信息, 然后,使用该局部解码高频带生成用辅助信息、以及频域信号X(j,i),生成伪局部 解码高频带信号。

例如,时间包络信息计算部2f在使用根据时间包络信息算出的时间包络来调整 伪局部解码高频带信号的时间包络时,将最接近与频域信号X(j,i)的高频带信号 相应的频带的时间包络信息输出作为计算出的时间包络信息。此处,可以基于调整时 间包络后的伪局部解码高频带信号与对应于频域信号X(j,i)的高频带信号的频带 的差分信号来判断是否接近与频域信号X(j,i)的高频带信号相应的频带,也可以 计算这两个信号的时间包络,根据该时间包络的误差来判断是否接近与频域信号X (j,i)的高频带信号相应的频带。

另外,时间包络计算控制信息生成部2j例如也可以根据从量化/编码部2g接收的 时间包络信息的编码所需的信息量(更具体地讲是比特数),生成表示是否由语音解 码装置1实施时间包络计算处理的时间包络计算控制信息。而且,时间包络计算控制 信息生成部2j也可以生成与语音解码装置1在时间包络计算处理中使用的低频带时 间包络的选择相关的时间包络计算控制信息。而且,时间包络计算控制信息生成部 2j也可以生成与语音解码装置1中的低频带时间包络计算方法相关的时间包络计算 控制信息。

更具体地讲,时间包络计算控制信息生成部2j例如在对从量化/编码部2g接收的 时间包络信息进行编码所需的信息量(更具体地讲是比特数)等于规定的阈值、或小 于阈值的情况下,生成指示语音解码装置1实施时间包络计算处理的时间包络计算控 制信息。另一方面,时间包络计算控制信息生成部2j在时间包络信息的编码所需的 信息量大于阈值的情况下,生成指示语音解码装置1不实施时间包络计算处理的时间 包络计算控制信息。

而且,也可以以使时间包络信息的编码所需的信息量等于规定的阈值、或小于阈 值的方式,生成与语音解码装置1在时间包络计算处理中使用的低频带时间包络的选 择相关的时间包络计算控制信息。此时,可以向时间包络信息计算部2f通知时间包 络信息的编码所需的信息量与阈值的比较结果,时间包络信息计算部2f根据被通知 的比较结果重新计算时间包络信息。另外,在重新计算时间包络信息的情况下,量化 /编码部2g对重新计算的时间包络信息进行编码/量化。此处,时间包络信息的重新计 算次数没有限定。

在本变形例中,只要基于时间包络信息的编码所需的信息量计算时间包络计算控 制信息即可,所生成的时间包络计算控制信息只要是第1实施方式的语音解码装置1 的第3~第6变形例的时间包络计算控制信息中的任意1个以上即可。

如上述这样由时间包络计算控制信息生成部2j生成的时间包络计算控制信息被 高频带编码序列构成部2h附加到高频带编码序列中而构成高频带编码序列。

[第1实施方式的语音编码装置的第2变形例]

图19是示出第1实施方式的语音编码装置2的第2变形例的结构的图,图20 是示出图19的语音编码装置2的语音编码步骤的流程图。

图19所示的语音编码装置2相对于第1实施方式的语音编码装置2,进一步追 加了低频带解码部2k。

该低频带解码部2k从低频带编码部2b接收低频带编码序列,对低频带编码序列 进行解码逆量化,取得局部解码低频信号。另外,在能够从低频带编码部2b取得量 化后的低频带信号的情况下,低频带解码部2k也可以对量化后的低频带信号进行逆 量化,取得局部解码低频信号。对此,低频带时间包络计算部2e1~2en使用由低频带 解码部2k取得的局部解码低频信号,计算第1~第n低频带时间包络。

该第1实施方式的语音编码装置2的第2变形例也可应用于第1实施方式的语音 编码装置2的第1变形例。

[第1实施方式的语音编码装置的第3变形例]

图21是示出第1实施方式的语音编码装置2的第3变形例的结构的图,图22 是示出图21的语音编码装置2的语音编码步骤的流程图。

图21所示的语音编码装置2与第1实施方式的语音编码装置2的不同之处在于, 具有频带合成滤波器组部2m,来取代下采样部2a。

该频带合成滤波器组部2m从频带分割滤波器组部2c接收频域信号X(j,i), 针对与低频带信号相应的频带进行频带合成,取得下采样信号。例如能够按照 “ISO/IEC 14496-3”规定的“MPEG4 AAC”的SBR中的下采样合成滤波 (Downsampledsynthesis filterbank)的方法利用频带合成来取得下采样信号(“ISO/IEC 14496-3 subpart 4 General Audio Coding”)。

该第1实施方式的语音编码装置2的第3变形例也可以应用于第1实施方式的语 音编码装置2的第1~第2变形例。

关于第1实施方式的语音编码装置2的第4变形例,在所述第1实施方式的语音 编码装置2的时间包络信息计算部2f中计算g(l,i)时,实施与上述第1实施方式 的语音解码装置1的第7变形例对应的规定处理。另外,也可以与第1实施方式的语 音解码装置1的第7变形例相同,在实施规定处理后使用低频带的时间包络来计算g (l,i),也可以在使用低频带的时间包络计算出g(l,i)后实施规定的处理,计算g (l,i)。

该第1实施方式的语音编码装置2的第4变形例也可应用于第1实施方式的语音 编码装置2的第1~第3变形例。

在将该第1实施方式的语音编码装置2的第4变形例应用于第1实施方式的语音 编码装置2的第1变形例时,也可以根据g(l,i)相对于上述H(l,i)的误差,在 上述时间包络信息计算控制信息中,包含表示上述第1实施方式的语音解码装置1 是否实施上述规定处理的信息。

[第2实施方式]

接着,说明本发明的第2实施方式。

图23是示出第2实施方式的语音解码装置101的结构的图,图24是示出图23 的语音解码装置101的语音解码步骤的流程图。图23所示的语音解码装置101与第 1实施方式的语音解码装置1的不同之处在于,还追加了频率包络叠加部(频率包络 叠加单元)1q、以及具有时间/频率包络调整部(时间频率包络调整单元)1p来取代 时间包络调整部1i(1c~1e、1h、1j、以及1p有时也称为频带扩展部(频带扩展单 元)。)。

编码序列解析部1d对从解复用部1a提供的高频带编码序列进行解析,取得编码 后的高频带生成用辅助信息、量化后的时间/频率包络信息。

编码序列解码/逆量化部1e对从编码序列解析部1d提供的编码后的高频带生成 用辅助信息进行解码,得到高频带生成用辅助信息,并且对从编码序列解析部1d提 供的量化后的时间/频率包络信息进行逆量化,取得时间/频率包络信息。

频率包络叠加部1q从时间包络计算部1g接收时间包络ET(l,i),从编码序列 解码/逆量化部1e接收频率包络信息。然后,频率包络叠加部1q根据频率包络信息 计算频率包络,将频率包络叠加在时间包络中。详细地讲,例如频率包络叠加部1q 按照以下步骤进行处理。

首先,频率包络叠加部1q通过下式变换时间包络。

[式48]

E0(m,i)=ET(l,i)

kl-kxmkh-kx,kl=FH(l)kh=FH(l+1)-1,

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

接着,频率包络叠加部1q将高频带分割为mH(mH≥1)个副频带。此处,将这 些副频带记为B(F)k(k=1,2,3,···,mH)。另外,以下,为了便于记载,定义以 表示副频带B(F)k(1≤k≤mH)边界的mH+1个索引为要素的数组GH,使信号XH(j,i)、GH(k)≤j<GH(k+1)、t(s)≤i<t(s+1)、0≤s<sE对应于副频带B(F)k的成分。其中,GH(1)=kx、GH(mH+1)=kmax+1。

接着,频率包络叠加部1q通过下式计算频率包络。

[式49]

EF,dec(k,s)=100.1×sfdec(k,s),1kmH,

0≤s<sE

此处,上述sfdec(k,s)(其中,1≤k≤mH、0≤s<sE)是对应于副频带B(F)k的比例因子。

另外,也可以通过下式计算上述频率包络。

[式50]

EF,dec(k,s)=64×2sfdec(k,s),1kmH

0≤s<sE

在本实施方式中,上述EF,dec(k,s)的形式不限于上述例子。

此处,频率包络叠加部1q通过以下方法计算上述sfdec(k,s)。首先,如下式所 示,上述sfdec(k,s)内的几个与副频带对应的比例因子是与时间无关的常数(此后 将这些与副频带对应的的索引k的集合记为NC)。

[式51]

sfdec(k,s)=C,kNc,0s<sE

此处,也可以是C=0,在本实施方式中,C的值没有规定。并且,如果整数1 不包含在集合Nc中,则频率包络叠加部1q根据频率包络信息取得比例因子sfdec(1、 s)、0≤s<s。

然后、频率包络叠加部1q从k=2到k=mH反复下述的(步骤k)处理,计算上 述比例因子。

(步骤k)

如果整数k不包含在集合Nc中,则根据频率包络信息取得比例因子的差分dsfdec(k、s)、0≤s<s,通过下式:

[式52]

sfdec(k,s)=sfdec(k-1,s)+dsfdec(k,s)

0≤s<sE

计算比例因子,使整数k加1,进入下一(步骤k)处理。另一方面,在整数k 包含在集合Nc中的情况下、直接使整数k加1,进入下一(步骤k)处理。

另外,在根据频率包络信息取得比例因子的差分sfdec(1、s)、0≤s<sE的情况下, 也可以使用从频带分割滤波器组部1c接收的频域信号的低频带成分计算sfdec(0、s)、 0≤s<sE,实施上述步骤k的处理。例如,在后述的式63、64、以及65中,将X(j, i)置换为Xdec(j,i),将使用满足在k=0时0≤kl≤kh<kX的规定的kl、以及kh而 计算出的sf(0、s)设为sfdec(0、s)。

此处,也可以与上述例子不同,频率包络信息可以与比例因子sfdec(k,s)本身 对应。另外,频率包络信息也可以是在使用第s-1个帧中的比例因子sfdec(k、s-1) 通过下式计算第s(s≥1)个帧中的比例因子sfdec(k、s)、1≤k≤mH时的时间方向 的差分dtsf(s、k)、1≤s<sE、1≤k≤mH

[式53]

sfdec(k,s)=sfdec(k,s-1)+dtsf(s,k),

1≤k≤mH,1≤s<sE

其中,在该情况下,使用上述方法等其它手段取得与初始值对应的sfdec(k、0)、 1≤k≤mH

而且,也可以根据低频带成分的比例因子、以及高频带的副频带的比例因子中的 至少1个以上,使用内插/外插求出所述副频带的比例因子。此时,频率包络信息是 上述内插/外插中使用的副频带的比例因子、以及高频带内的内插/外插参数。另外, 在计算上述低频带成分的比例因子时,使用从频带分割滤波器组部1c接收的频域信 号的低频带成分。

另外,内插/外插参数也可以是规定的参数。进而,根据所述规定的内插/外插参 数、以及频率包络信息包含的内插/外插参数计算实际用于内插/外插的参数,进行所 述比例因子的内插/外插。而且,在不接收频率包络信息的情况以及频率包络信息不 包含内插/外插参数的情况中的至少1个以上的情况下,也可以仅使用规定的内插/外 插参数,进行所述比例因子的内插/外插。另外,在本实施方式中,上述内插/外插的 方法没有限定。

另外,上述频率包络信息的形式只是一例,只要是表示高频带的各副频带的信号 功率或信号振幅的频率方向的变动的参数即可。在本实施方式中,频率包络信息的形 式没有限定。

接着,频率包络叠加部1q使用下式变换上述EF(k,s)。

[式54]

E1(m,s)=EF,dec(k,s)

kl-kxmkh-kx,kl=GH(k)kh=GH(k+1)-1,

1≤k≤nH

0≤s<sE

接着,频率包络叠加部1q使用按照上述那样变换的时间包络E0(m,i)、以及 频率包络E1(m,i),通过下式计算量E2(m,i)。

[式55]

E2(m,i)=E1(m,s)·E0(m,i)

0≤m≤kmax-kx

t(s)≤i<t(s+1),0≤s<sE

另外,上述E2(m,i)也可以是下式给出的形式。

[式56]

E2(m,i)=E1(m,s)·Σk=0kmax-kxE0(k,i),

0≤m≤kmax-kx

t(s)≤i<t(s+1),0≤s<sE

而且,也可以是下式给出的形式。

[式57]

E2(m,i)=E1(m,s)·Σk=FH(Q(m))-kxFH(Q(m)+1)-kx-1E0(k,i),

0≤m≤kmax-kx

t(s)≤i<t(s+1),0≤s<sE

此处,Q(m)、0≤m<kmax-kx是满足下式条件的整数。

[式58]

FH(Q(m))-kx≤m<FH(Q(m)+1)-kx

1≤Q(m)≤nH

另外,也可以是下式这样的形式。

[式59]

E2(m,i)=E1(m,s)(Σk=FH(Q(m))-kxFH(Q(m)+1)-kx-1E1(k,s)+ϵ)·Σk=FH(Q(m))-kxFH(Q(m)+1)-kx-1E0(k,i),

0≤m≤kmax-kx

t(s)≤i<t(s+1),0≤s<sE

其中,在本发明中,上述E2(m,i)的形式不限于上述例。

接着,频率包络叠加部1q使用上述E2(m,i)通过下式计算量E(m,i)。

[式60]

E(m,i)=C(s)·E2(m,i),

0≤m≤kmax-kx

t(s)≤i<t(s+1),0≤s<sE

此处,系数C(s)由下式给出。

[式61]

C(s)=Σi=t(s)t(s+1)-1Σp=0kmax-kxE0(p,i)(Σi=t(s)t(s+1)-1Σp=0kmax-kxE2(p,i))+ϵ

0≤s<sE

另外,也可以是下式:

[式62]

C(s)=Σi=t(s)t(s+1)-1Σp=0kmax-kxE1(p,i)(Σi=t(s)t(s+1)-1Σp=0kmax-kxE2(p,i))+ϵ

0≤s<sE

时间/频率包络调整部1p使用从频率包络叠加部1q提供的时间/频率包络E1(m, i)调整从高频带生成部1h提供的高频带信号XH(j,i)、kx≤j<kmax的时间/频率包 络。

另外,本发明的第1实施方式的语音解码装置1的第1~第6变形例也可应用于 该本发明的第2实施方式的语音解码装置101。

图25是示出第2实施方式的语音编码装置102的结构的图,图26是示出图25 的语音编码装置102的语音编码步骤的流程图。图25所示的语音编码装置102与第 1实施方式的语音编码装置2的不同之处在于,还追加了频率包络信息计算部2n。

即,频率包络信息计算部2n由频带分割滤波器组部2c提供高频带信号X(j,i) {0≤j<N、0≤i<t(sE)},计算频率包络信息。详细地讲,以如下方式计算频率包 络信息。

首先,频率包络信息计算部2n通过下式计算副频带B(F)k(其中,k=1,2,3,···, mH)上的功率的频率包络。

[式63]

EF(k,s)=Σi=t(s)t(s+1)-1Σj=klkh|X(j,i)|2(t(s+1)-t(s))·(kh-kl+1)

kl=GH(k),kh=GH(k+1)-1,0≤s<sE

接着,频率包络信息计算部2n计算副频带B(F)k的比例因子sf(k、s)、1≤k≤ mH。例如通过下式计算上述sf(k、s)。

[式64]

sf(k,s)=10log10EF(k,s),

kl=GH(k),kh=GH(k+1)-1,1≤k≤mH,0≤s<sE

另外,频率包络信息计算部2n也可以按照“ISO/IEC 14496-3 4.B.18”记载的方 法,通过下式计算上述sf(k,s)。

[式65]

sf(k,s)=log2(164·EF(k,s)),

kl=GH(k),kh=GH(k+1)-1,1≤k≤mH,0≤s<sE

另外,也可以对应于语音解码装置101侧,通过下式:

[式66]

sf(k,s)=C,kNc,0s<sE

进行设定。

而且,频率包络信息计算部2n也可以将频率包络信息设为上述比例因子sf(k、 s)(1≤k≤mH)。另外,频率包络信息也可以是下式这样的形式。即,通过下式:

[式67]

dsf(k,s)=sf(k,s)-sf(k-1,s),

0≤s<sE,2≤k≤mH

定义上述比例因子sf(k,s)的差分,将上述dsf(k、s)与sf(1、s)(0≤s< sE)设为频率包络信息。

另外,也可以与第2实施方式的语音解码装置101的频率包络叠加部1q同样地, 使用低频带的频域信号X(j,i)(0≤j<kx)计算上述比例因子sf(0,s),将根据该 比例因子sf(0,s)算出的dsf(1,s)包含在频率包络信息中。

另外,频率包络信息是在根据低频带成分的比例因子对高频带的上述比例因子进 行外插而进行近似时的基于低频带的外插参数。另外,频率包络信息是根据高频带中 的几个副频带的比例因子、使用内插/外插求出这些副频带以外的部分时的副频带的 比例因子、以及高频带内的内插/外插参数。将前者与后者的形式组合而成的信息也 可以是频率包络信息。

在本发明中,上述频率包络信息不限于上述例子。

作为频率包络信息的量化/编码方法,例如,在对频率包络信息进行标量量化后、 进行以哈夫曼编码、算术编码为代表的熵编码。而且,也可以通过规定的码本对频率 包络信息进行矢量量化,将其索引作为码元。

具体地讲,例如也可以在对上述比例因子sf(k,s)进行标量量化后,进行以哈 夫曼编码或算术编码为代表的熵编码。而且,也可以在对上述dsf(k,s)进行标量量化 之后进行熵编码。而且,也可以利用规定的码本对上述比例因子sf(k,s)进行矢量量 化,将其索引作为码元。而且,也可以利用规定的码本对上述dsf(k,s)进行矢量量化, 将其索引作为码元。而且,也可以对标量量化后的比例因子sf(k,s)的差分进行熵 编码。

例如,按照“ISO/IEC 14496-3 4.B.18”记载的方法,使用上式的sf(k,s),通 过下式:

[式68]

EQ(k,s)=INT(a·max(sf(k,s),0)+0.5),

EDelta(k,s)=EQ(k,s)-EQ(k-1,s),

2≤k≤mH,0≤s<sE

计算EDelta(k,s),对EDelta(k,s)进行哈夫曼编码。

此处,当某个整数l包含在集合Nc中时,也可以省略sf(l,s)(0≤s<sE)或 dsf(l,s)(0≤s<sE)的上述量化/编码。

在本发明中,上述频率包络信息的量化/编码不限于上述例子。

本发明的第1实施方式的语音编码装置2的第1~第4变形例也可应用于该本发 明的第2实施方式的语音编码装置102。例如,图27是示出将本发明的第1实施方 式的语音编码装置2的第1变形例应用于本发明的第2实施方式的语音编码装置102 中时的结构的图,图28是示出图27的语音编码装置102的语音编码步骤的流程图。 另外,图29是示出将本发明的第1实施方式的语音编码装置2的第2变形例应用于 本发明的第2实施方式的语音编码装置102时的结构的图,图30是示出图29的语音 编码装置102的语音编码步骤的流程图。

[第3实施方式]

接着,说明本发明的第3实施方式。

图31是示出第3实施方式的语音解码装置201的结构的图,图32是示出图31 的语音解码装置201的语音解码步骤的流程图。图31所示的语音解码装置201与第 1实施方式的语音解码装置1的不同之处在于,还追加了时间包络计算控制部1s、具 备编码序列解码/逆量化部1r以及包络调整部1t来取代编码序列解码/逆量化部1e以 及时间包络调整部1i(1c~1d、1h、1j、以及1r~1t有时也称为频带扩展部(频带扩 展单元)。)。

编码序列解析部1d对从解复用部1a提供的高频带编码序列进行解析,得到编码 后的高频带生成用辅助信息、以及时间包络计算控制信息,进而得到编码后的时间包 络信息、或编码后的第2频率包络信息。

编码序列解码/逆量化部1r对从编码序列解析部1d提供的编码后的高频带生成用 辅助信息进行解码,得到高频带生成用辅助信息。

高频带生成部1h使用从编码序列解码/逆量化部1r提供的高频带生成用辅助信息 将从频带分割滤波器组部1c提供的低频带信号Xdec(j,i)、0≤j<kx复制到高频带, 由此生成高频带信号Xdec(j,i),kx≤j≤kmax

时间包络计算控制部1s根据从编码序列解析部1d提供的时间包络计算控制信 息,确认包络调整部1t是否通过第2频率包络信息调整高频带信号的包络。在包络 调整部1t不通过第2频率包络信息调整高频带信号的包络的情况下,编码序列解码/ 逆量化部1r对从编码序列解析部1d提供的编码后的时间包络信息进行解码/逆量化, 得到时间包络信息。另一方面,在包络调整部1t通过第2频率包络信息调整高频带 信号的包络的情况下,时间包络计算控制部1s向低频带时间包络计算部1f1~1fn输 出低频带时间包络计算控制信号,向时间包络计算部1g输出时间包络计算控制信号, 指示低频带时间包络计算部1f1~1fn以及时间包络计算部1g不进行包络计算的处理。

另外,编码序列解码/逆量化部1r对从编码序列解析部1d提供的编码后的第2 频率包络信息进行解码/逆量化,得到第2频率包络信息。而且,在该情况下,包络 调整部1t使用从编码序列解码/逆量化部1r提供的第2频率包络信息调整从高频带生 成部1h提供的高频带信号XH(j,i)(kX≤j<kmax)的频率包络。

具体地说、使用解码/逆量化后的上述第2频率包络信息,按照语音解码装置101 的频率包络叠加部1q中的EF,dec(k,s)的计算方法,计算与上述EF,dec(k,s)对 应的量E3(k,s)、1≤k≤mH、0≤s<sD,通过下式变换上述E3(k,s)。

[式69]

E(m,i)=E3(k,s)

kl-kxmkh-kx,kl=GH(k)kh=GH(k+1)-1,

1≤k≤mH

0≤s<sE

此后的处理是按照语音解码装置101的时间/频率包络调整部1p的处理步骤,取 得调整包络后的高频带信号Y(i,j){kx≤j≤kmax、t(s)≤i<t(s+1)、0≤s<sE}。

本发明第1实施方式的语音解码装置1的第1~第7变形例也可应用于该本发明 第3实施方式的语音解码装置201。

图35是示出第3实施方式的语音编码装置202的结构的图,图36是示出图35 的语音编码装置202的语音编码步骤的流程图。图35所示的语音编码装置202与第 1实施方式的语音编码装置2的不同之处在于,还追加了时间包络计算控制信息生成 部2j以及第2频率包络信息计算部2o。

第2频率包络信息计算部2o由频带分割滤波器组部2c提供高频带信号X(j,i) {kx≤j<N、t(s)≤i<t(s+1)、0≤s<sE},计算第2频率包络信息(步骤S207 的处理)。

该第2频率包络信息也可以通过与所述第2实施方式的语音编码装置102中的频 率包络信息计算方法相同的方法求出。但是,在本实施方式中,不限于第2频率包络 信息的计算方法。

量化/编码部2g对时间包络信息以及第2频率包络信息进行量化/编码。时间包络 信息可以进行与第1以及第2实施方式的语音编码装置的量化/编码部2g中的量化/ 编码相同的量化/编码。第2频率包络信息可以进行与第2实施方式的语音编码装置 的量化/编码部2g中的频率包络信息的量化/编码相同的量化/编码。但是,在本实施 方式中,时间包络信息、以及第2频率包络信息的量化/编码方法没有限定。

时间包络计算控制信息生成部2j使用从频带分割滤波器组部2c接收的频域信号 X(j,i)、从时间包络信息计算部2f接收的时间包络信息、以及从第2频率包络信息 计算部2o接收的第2频率包络信息中的至少1个以上,生成时间包络计算控制信息 (步骤S209的处理)。所生成的时间包络计算控制信息只要是上述第3实施方式的语 音解码装置201中的时间包络计算控制信息即可。

时间包络计算控制信息生成部2例如也可与第1实施方式例的语音编码装置2 的第1变形例相同。

时间包络计算控制信息生成部2j例如与第1实施方式的语音编码装置2的第1 变形例同样,使用时间包络信息和第2频率包络信息,分别生成伪局部解码高频带信 号,与原始信号进行比较。在使用第2频率包络信息而生成的伪局部解码高频带信号 与原始信号接近的情况下,生成指示解码装置利用第2频率包络信息调整高频带信号 的信息,作为时间包络计算控制信息。关于上述各伪局部解码高频带信号与原始信号 的比较,例如也可以计算差分信号,根据差分信号是否较小。而且,也可以是在计算出 上述各伪局部解码高频带信号、以及原始信号的时间包络后,计算上述各伪局部解码 高频带信号与原始信号的时间包络的差分,根据所述差分是否较小。而且,也可以根据 与上述原始信号的差分信号、和/或包络的差分的最大值是否较小。在本实施方式中, 比较方法不限于上述方法。

时间包络计算控制信息生成部2j在生成上述时间包络计算控制信息时,也可以 还使用量化后的时间包络信息、以及量化后的第2频率包络信息中的至少1个。

在时间包络计算控制信息是指示解码装置利用第2频率包络信息调整高频带信 号的信息的情况下,编码构成部2h利用从编码/逆量化部2g接收的编码后的高频带生 成用辅助信息、编码后的第2频率包络信息来构成高频带编码序列,在时间包络计算 控制信息不是指示解码装置利用第2频率包络信息调整高频带信号的信息的情况下, 编码构成部2h利用从编码/逆量化部2g接收的编码后的高频带生成用辅助信息和编 码后的时间包络信息来构成高频带编码序列(步骤S211的处理)。

本发明的第1实施方式的语音编码装置2的第1~第4变形例也可应用于该本发 明第3实施方式的语音编码装置202。

[第4实施方式]

接着,说明本发明的第4实施方式。

图33是示出第4实施方式的语音解码装置301的结构的图,图34是示出图33 的语音解码装置301的语音解码步骤的流程图。图33所示的语音解码装置201与第 1实施方式的语音解码装置1的不同之处在于,追加了时间包络计算控制部1s以及 频率包络叠加部1u、具备编码序列解码/逆量化部1r以及时间/频率包络调整部1v来 取代编码序列解码/逆量化部1e以及时间包络调整部1i(1c~1d、1h、1j、1r~1s、 以及1u~1v有时也称为频带扩展部(频带扩展单元)。)。

编码序列解析部1d对从解复用部1a提供的高频带编码序列进行解析,得到编码 后的高频带生成用辅助信息、以及时间包络计算控制信息,进而得到编码后的时间包 络信息、以及编码后的频率包络信息、或编码后的第2频率包络信息。

时间包络计算控制部1s根据从编码序列解析部1d提供的时间包络计算控制信 息,确认包络调整部1v是否利用第2频率包络信息调整高频带信号的包络,在时间/ 频率包络调整部1v不利用第2频率包络信息调整高频带信号的包络的情况下,编码 序列解码/逆量化部1r对从编码序列解析部1d提供的编码后的时间包络信息进行解码 /逆量化,得到时间包络信息。

另一方面,在时间/频率包络调整部1v利用第2频率包络信息调整高频带信号的 包络的情况下,与第3实施方式的步骤S190的处理同样地进行处理。另外,时间/ 频率包络调整部1v的处理也与第3实施方式的步骤S191的处理相同。

本发明第1实施方式的语音解码装置1的第1~第7变形例也可应用于该本发明 第4实施方式的语音解码装置301。

图37是示出第4实施方式的语音编码装置302的结构的图,图38是示出图37 的语音编码装置302的语音编码步骤的流程图。图37所示的语音编码装置302与第 1实施方式的语音编码装置2的不同之处在于,还追加了时间包络计算控制信息生成 部2j、频率包络信息计算部2p、以及第2频率包络信息计算部2o。

量化/编码部2g对时间包络信息、频率包络信息、以及第2频率包络信息进行量 化/编码。该时间包络信息能够与第1以及第2实施方式的编码装置的量化/编码部2g 中的量化/编码同样地进行量化/编码。频率包络信息、第2频率包络信息能够与第2 实施方式的编码装置的量化/编码部2g中的频率包络信息的量化/编码同样地进行量 化/编码。但是,在本发明中,时间包络信息、以及第2频率包络信息的量化/编码方 法没有限定。

时间包络计算控制信息生成部2j使用从频带分割滤波器组部2c接收的频域信号 X(j,i)、从时间包络信息计算部2f接收的时间包络信息、从频率包络信息计算部 2p接收的频率包络信息、以及从第2频率包络信息计算部接收的第2频率包络信息 2o中的至少1个以上,生成时间包络计算控制信息(步骤S250的处理)。生成的时 间包络计算控制信息只要是上述第4实施方式的语音解码装置301中的时间包络计算 控制信息即可。

时间包络计算控制信息生成部2j例如也可以与第1实施方式的编码装置2的第1 变形例同样。而且,时间包络计算控制信息生成部2j例如也可以与第3实施方式的 语音编码装置202同样。

时间包络计算控制信息生成部2j例如与第1实施方式的编码装置2的第1变形 例同样,使用时间包络信息、频率包络信息、以及第2频率包络信息,分别生成伪局 部解码高频带信号,与原始信号进行比较。在使用第2频率包络信息而生成的伪局部 解码高频带信号与原始信号接近的情况下,生成指示解码装置通过第2频率包络信息 调整高频带信号的信息,作为时间包络计算控制信息。

关于上述各伪局部解码高频带信号与原始信号的比较,也可以与第3实施方式的 语音编码装置202的时间包络计算控制信息生成部2j相同,在本实施方式中,不限 定比较方法。

时间包络计算控制信息生成部2j在生成上述时间包络计算控制信息时,也可以 还使用量化后的时间包络信息、量化后的频率包络信息、以及量化后的第2频率包络 信息中的至少1个。

在时间包络计算控制信息是指示解码装置利用第2频率包络信息调整高频带信 号的信息的情况下,编码构成部2h使用从编码/逆量化部1g接收的编码后的高频带生 成用辅助信息、编码后的第2频率包络信息构成高频带编码序列,在时间包络计算控 制信息不是指示解码装置利用第2频率包络信息调整高频带信号的信息的情况下,编 码构成部2h使用从编码/逆量化部1g接收的编码后的高频带生成用辅助信息、编码 后的时间包络信息、以及编码后的频率包络信息构成高频带编码序列(步骤S252的 处理)。

本发明的第1实施方式的语音编码装置2的第1~第4变形例也可应用于该本发 明的第4实施方式的语音编码装置302。

[第1实施方式的语音解码装置的第8变形例]

在本变形例中,第1实施方式的语音解码装置1的时间包络计算部1g对所计算 的时间包络实施基于规定函数的处理。例如,时间包络计算部1g在时间上对时间包 络进行归一化处理,通过下式计算时间包络ET’(l,i)。

[式70]

ET(l,i)=ET(l,i)t(s+1)-t(s)Σi=t(s)t(s+1)-1ET(l,i),

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

在本变形例中,能够在计算时间包络ET’(l,i)后,在其后的处理中将量ET(l,i)置换 为量ET’(l,i)进行处理。

根据这样的变形例,能够不改变高频带生成部1h生成的高频带信号XH(j,i)的帧 s中的频带FH(l)≤j<FH(l+1)的能量总量,而仅调整帧s的频带FH(l)≤j<FH(l+1)内的 高频带信号XH(j,i)(FH(l)≤j<FH(l+1))的时间的形状。

上述第1实施方式的语音解码装置1的第8变形例也可应用于第1实施方式的语 音解码装置1的第1~第7变形例、以及第2~第4实施方式的各语音解码装置,此 时,只要将ET(l,i)置换为ET’(l,i)即可。

[第1实施方式的语音解码装置的第9变形例]

在本变形例中,在第1实施方式的语音解码装置1的第1~第n低频带时间包络 计算部1f1~1fn中,当在时间方向对量L0(k,i)进行平滑化而取得时间包络L1(k,i)时, 在从帧s-1转移到帧s时保持L0(k,i)(t(s)-d≤i<t(s))。根据本变形例,能够对接近 与帧s-1之间的边界的帧s的量L0(k,i)(更具体地说,也能够对L0(k,i)(t(s)≤i< t(s)+d))也进行平滑化。

上述第1实施方式的语音解码装置1的第9变形例也可应用于第1实施方式的语 音解码装置1的第1~第8变形例、以及第2~第4实施方式的各语音解码装置。

[第1实施方式的语音编码装置的第5变形例]

在本变形例中,根据参照时间包络H(l,i)与上述g(l,i)的相关来实施第1实施方式 的语音编码装置2的时间包络信息计算部2f中的时间包络信息的计算。例如,时间 包络信息计算部2f如以下这样计算时间包络信息。

即,通过下式计算H(l,i)与g(l,i)的相关系数corr(l)。

[式71]

corr(l)=Σi=t(s)t(s+1)-1(H(l,i)-Have(l))(g(l,i)-gave(l))Σi=t(s)t(s+1)-1(H(l,i)-Have(l))2Σi=t(s)t(s+1)-1(g(l,i)-gave(l))2

1≤l≤nH,t(s)≤i<t(s+1),0≤s<sE

将上述相关系数corr(l)与规定阈值进行比较,根据其比较结果计算时间包络信 息。而且,求出相当于corr2(l)的值,与规定的阈值进行比较,根据其比较结果计算 时间包络信息,由此也能够实现。

例如,如以下这样计算时间包络信息。设与上述相关系数进行比较的规定阈值为 corrth(l)、按照式21那样给出gdec(l,i),通过下式计算时间包络信息。

[式72]

Al,k(s)=0,Al,0(s)=const(0)corr(l)<corrth(l)Al,k(s)=const(k),Al,0(s)=0otherwise

const(k)≠0,k>0

当上述例子中计算的时间包络信息被输入到第1实施方式的解码装置1的第2 变形例时,在副频带B(T)l中,在Al,k(s)=0、Al,0(s)=const(0)的情况(即,在编码装置中, 相关系数小于规定阈值的情况)下,时间包络计算控制部1m向第k个(k>0)低频带时 间包络计算部1fk输出低频带时间包络计算控制信号,控制为低频带时间包络计算部 1fk不实施低频带时间包络计算处理。另一方面,在Al,k(s)=const(k),Al,0(s)=0的情况 (即,在编码装置中相关系数大于规定的阈值的情况)下,时间包络计算控制部1m 向第k个(k>0)低频带时间包络计算部1fk输出低频带时间包络计算控制信号,控制为 低频带时间包络计算部1fk实施低频带时间包络计算处理。

在本变形例中,只要根据参照时间包络H(l,i)与上述g(l,i)的相关来计算时间包络 信息即可,而不限于上述方法。

在根据上述第1实施方式的语音编码装置2记载的参照时间包络H(l,i)与g(l,i)的 误差(或权重误差)计算时间包络信息时,是根据参照时间包络H(l,i)与g(l,i)的一致 程度来计算时间包络信息。另一方面,在本变形例中,是根据参照时间包络H(l,i)与 g(l,i)的形状的相似程度来计算时间包络信息。

上述第1实施方式的语音编码装置2的第5变形例也可应用于第1实施方式的语 音编码装置2的第1~第5变形例、以及第2~第4实施方式的语音编码装置。

[第2实施方式的语音解码装置的第1变形例]

在本变形例中,在第2实施方式的语音解码装置101的频率包络叠加部1q中, 对频率包络EF,dec(k,s)实施基于规定函数的处理。例如,频率包络叠加部1q实施 基于对下式给出的频率包络EF,dec(k,s)进行平滑化的函数的处理。

[式73]

EF,dec,Filt(k,i)=Σj=0dhEF,dec,Temp(k,i-j)·sch(j)

其中,

[式74]

EF,dec,Temp(k,i)=EF,dec(k,s),t(s)≤i<t(s+1)

sch(j)、dh分别是规定的平滑化系数、平滑化次数。此时,在以后的处理中,将 EF,dec,Filt(k,i)置换为EF,dec(k,s)进行处理。

而且,可以在上述式73中包含根据与该频率包络EF,dec(k,s)对应的帧的信号 特性决定是否对频率包络EF,dec(k,s)进行平滑化的函数。而且,表示是否进行平 滑化的信息包含在编码序列中,可以包含根据该信息决定是否对频率包络EF,dec(k, s)进行平滑化的函数。

而且,上述第2实施方式的语音解码装置101的第1变形例也可以应用于第4 实施方式的语音解码装置。

[第2实施方式的语音解码装置的第2变形例]

在第2实施方式的语音解码装置101的频率包络叠加部1q中,量E(m,i)是利用 C(s)校正了E2(m,i)后的值(式60)。另外,根据式61,帧s的带宽kx≤m≤kmax中的 时间/频率包络调整后的高频带信号的能量被校正为帧s的带宽kx≤m≤kmax中的时间 包络E0(m,i)的总和。另一方面,根据式62,帧s的频带kx≤m≤kmax中的时间/频率 包络调整后的高频带信号的能量被校正为帧s的频带kx≤m≤kmax中的频率包络 E1(m,i)的总和。在本变形例中,以在调整时间/频率包络后也保持帧s的频带kx≤m≤ kmax中的时间/频率包络调整后的高频带信号能量的方式、通过下式给出C(s)。

[式75]

C(s)=Σi=t(s)t(s+1)-1Σj=kxkmax|XH(j,i)|2(Σi=t(s)t(s+1)-1Σp=0kmax-kxE2(p,i))+ϵ

而且,也可以以使帧s的频带kx≤m≤kmax中的时间/频率包络调整后的高频带信 号的能量成为帧s的频带kx≤m≤kmax中的时间包络E2(m,i)的总和的方式,通过下式 给出C(s)。

[式76]

C(s)=1

上述第2实施方式的语音解码装置101的第2变形例也可应用于第2实施方式的 语音解码装置101的第1变形例、以及第4实施方式的语音解码装置。

[第2实施方式的语音解码装置的第3变形例]

图39是示出本发明的第2实施方式的语音解码装置101的第3变形例的结构的 图,图40是示出图39的语音解码装置101的语音解码步骤的流程图。本变形例与第 2实施方式的语音解码装置101的不同之处在于,具有频率包络计算部1w,来取代 频率包络叠加部1q。

本变形例的频率包络计算部1w与第2实施方式频率包络叠加部1q相同地计算 频率包络E1(m,s)(步骤S119a)。

然后,时间/频率包络调整部1p使用时间包络ET(l,i)、以及频率包络E1(m,s)如以 下这样进行时间/频率包络的调整(步骤S120)。

即,时间/频率包络调整部1p与频率包络叠加部1q同样地将时间包络ET(l,i)变换 为E0(m,i)。

另外,与“MPEG4 AAC”的SBR中的HF调整(HF adjustment)同样地,通过 下式变换由编码序列解码/逆量化部1e提供的帧s中的噪声电平比例因子Q(m,s)。

[式77]

Q2(m,s)=E1(m,s)Q(m,s)1+Q(m,s)

0≤m<M,0≤s<sE

另外,使用根据用于决定是否附加由编码序列解码/逆量化部1e提供的正弦波的 参数而求出的量S(m,s),由下式给出帧s中的正弦波电平。

[式78]

S2(m,s)=E1(m,s)S(m,s)1+Q(m,s)

0≤m<M,0≤s<sE

另外,使用频率包络E1(m,s)、由编码序列解码/逆量化部1e提供的帧s中的噪声 电平比例因子Q(m,s)、取决于由编码序列解码/逆量化部1e提供的帧s的参数的函数 即δ(s),由下式给出增益。

[式79]

G(m,s)=E1(m,s)(ϵ+Ecurr(m,s))(1+δ(s)·Q(m,s))ifS(m,s)=0E1(m,s)(ϵ+Ecurr(m,s))Q(m,s)(1+Q(m,s))ifS(m,s)0

0≤m<M,0≤s<sE

此处,量Ecurr(m,s)由下式定义。

[式80]

Ecurr(m,s)=Σi=t(s)t(s+1)-1Σj=klkh|XH(j,i)|2(t(s+1)-t(s))(kh-kl+1),

kl-kxmkh-kx,kl=GH(k)kh=GH(k+1)-1,1kmH

0≤l<nH,0≤s<sE

另外,也可通过下式进行定义。

[式81]

Ecurr(m,s)=Σi=t(s)t(s+1)-1|XH(m+kx,i)|2(t(s+1)-t(s),

0≤m<M,0≤s<sE

另外,S’(m,s)是表示在帧s中、是否存在附加在包含索引m表示的频率的副频 带B(F)k(GH(k)≤m<GH(k+1))内的正弦波的函数,在存在附加的正弦波的情况下, S’(m,s)为“1”,在其它情况下,S’(m,s)为“0”。

而且,使用上述量Ecurr(m,s),能够计算下述量X’H(m+kx,i)。

[式82]

XH(m+kx,i)=XH(m+kx,i)|XH(m+kx,i)|2Ecurr(m,s),

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

或者,上述量X’H(m+kx,i)也可以根据下式计算。

[式83]

XH(m+kx,i)=XH(m+kx,i)1kh-kl+1Σj=klkh|XH(j,i)|2Ecurr(m,s),

kl-kxmkh-kx,kl=GH(k)kh=GH(k+1)-1,1kmH

t(s)≤i<t(s+1),0≤s<sE

或者,上述量X’H(m+kx,i)也可以根据下式计算。

[式84]

XH(m+kx,i)=XH(m+kx,i)Σj=klkh|XH(j,i)|2Σn=kl-kxkh-kxEcurr(n,s),

kl-kxmkh-kx,kl=GH(k)kh=GH(k+1)-1,1kmH

t(s)≤i<t(s+1),0≤s<sE

如果这样地进行处理,则能够在频率索引m、或副频带B(F)k中在时间方向上使 高频带信号XH(m+kx,i)平坦化。因此,通过实施以后的处理,能够与高频带信号 XH(m+kx,i)的时间包络无关地输出基于由时间包络计算部1g算出的时间包络的高频 带信号。

此处,能够对上述增益、噪声电平比例因子、正弦波电平实施基于规定函数的处 理,计算增益G2(m,s)、噪声电平比例因子Q3(m,s)、正弦波电平S3(m,s)。例如,与 “MPEG4 AAC”的SBR中的HF调整(HF adjustment)同样地,对上述增益、本底 噪声·比例因子、正弦波电平实施基于用于避免无谓噪声叠加的增益限制(增益限制 器Gain limiter)、增益限制导致的能量损耗的补偿(增益放大器Gain booster)的 函数的处理,计算增益G2(m,s)、噪声电平比例因子Q3(m,s)、正弦波电平S3(m,s)(具 体例参照ISO/IEC 1449-3 4.6.18.7.5)。在实施了上述规定处理的情况下,在以后的处 理中,使用G2(m,s),Q3(m,s),S3(m,s),取代G(m,s),Q2(m,s),S2(m,s)。

使用通过上述得到的增益G(m,s)、本底噪声·比例因子Q2(m,s)、以及时间包络 E0(m,i)计算由下式给出的量G3(m,i)、Q4(m,i)。通过下式,根据时间包络计算增益以 及本底噪声·比例因子,经过以后的处理,最终能够从时间/频率包络调整部1p输出 已调整时间/频率包络的信号。

[式85]

G3(m,i)=E0(m,i)·G(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式86]

Q4(m,i)=E0(m,i)·Q2(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

在上述式中,是根据时间包络计算出增益、以及本底噪声·比例因子,也可以与 增益、以及本底噪声·比例因子同样地根据时间包络计算出正弦波电平。

另外,也可以对上述G3(m,i)、Q4(m,i)实施基于规定函数的处理。例如,基于进 行平滑化的函数的处理。计算由下式给出的GFilt(m,i)、QFilt(m,i)。

[式87]

GFilt(m,i)=Σj=0dhGTemp(m,i-j+dh)·sch(j)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式88]

QFilt(k,i)=Σj=0dhQTemp(m,i-j+dh)·sch(j)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

其中,sch(j)、dh分别是规定平滑化系数、平滑化次数。另外,GTemp(m,i)、QTemp(m,i) 由下式给出。

[式89]

GTemp(m,i+dh)=E0(m,i)·G(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式90]

QTemp(m,i+dh)=E0(m,i)·Q2(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

进而,通过基于下述函数的处理,也同样能得到平滑化的效果。

[式91]

GFilt(m,i)=Gold(m)·wold(m,i)+GTemp(m,i)·wcurr(m,i)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式92]

QFilt(m,i)=Qold(m)·wold(m,i)+QTemp(m,i)·wcurr(m,i)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

其中,wold(m,i)、wcurr(m,i)分别是规定的权重系数。另外,GTemp(m,i)、QTemp(m,i) 由下式给出。

[式93]

GTemp(m,i)=E0(m,i)·G(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式94]

QTemp(m,i)=E0(m,i)·Q2(m,s)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

另外,Gold(m)是前1帧(具体是帧s-1)中的与帧s的边界的时间索引(具体是 t(s)-1)的增益,由下式中的任意一个给出。

[式95]

Gold(m)=GTemp(m,t(s)-1)=E0(m,t(s)-1)·G(m,s-1)

0≤m<M,0≤s<sE

[式96]

Gold(m)=GFilt(m,t(s)-1)

0≤m<M,0≤s<sE

在实施了基于上述规定函数的处理的情况下,在以后的处理中,使用GFilt(m,s), QFilt(m,s),取代G3(m,s),Q4(m,s)。

另外,进行上述平滑化的函数可以包含用于决定是否根据由编码序列解码/逆量 化部1e提供的帧s的参数进行上述平滑化的函数。进而,表示是否进行平滑化的信 息包含在编码序列中,可以包含用于决定是否根据该信息进行上述平滑化的函数。进 而,可以包含用于决定是否根据上述信息中的至少一方进行上述平滑化的函数。

最后,时间/频率包络调整部1p通过下式,得到已调整时间/频率包络的信号。

[式97]

W1(m,i)=G3(m,i)·XH(m+kx,i)

Re{W2(m,i)}=Re{W1(m,i)}+Q4(m,i)·V0(f(i))

Im{W2(m,i)}=Im{W1(m,i)}+Q4(m,i)·V1(f(i))

[式98]

Re{Y(m,i)}=Re{W2(m,i)}+ψRe(m,s,i)

Im{Y(m,i)}=Im{W2(m,i)}+ψIm(m,s,i)

此处,V0、V1是规定噪声成分的数组,f是将索引i复写到上述数组上的索引的 函数,是规定正弦波成分的相位的数组,fsin是将索引i复写到上述数组 上的索引的函数(具体例参照“ISO/IEC 14496-3 4.6.18”)。

或者,在上述式97中,也可以使用X’H(m+kx,i),取代XH(m+kx,i)。

在本发明的第2实施方式的语音解码装置101的频率包络叠加部1q中应用上述 “MPEG4 AAC”的SBR中的HF调整的增益放大器时,按照每个副频带B(F)k(GH(k) ≤j<GH(k+1))以帧s为单位,进行增益限制导致的能量损耗的补偿。另一方面,根 据下式,按照每个副频带B(F)k(GH(k)≤j<GH(k+1)),针对高频带信号XH(j,i),以时 间索引i为单位,进行增益限制导致的能量损耗的补偿。

[式99]

GBoostTemp(k,i)=ϵ+Σj=GH(k)GH(k+1)-1E1(j,s)ϵ+Σj=GH(k)GH(k+1)-1(XH2(j,i)·G2(j,s)+S22(j,s)+δ(S2(j,s),s)·Q22(j,s))

G2(m,i)=GBoostTemp(k,i)·G(m,s)

Q3(m,i)=GBoostTemp(k,i)·Q2(m,s)

1≤k≤mH,GH(k)≤m+kx<GH(k+1),t(s)≤i<t(s+1),0≤s<sE

在上式中,能够对增益G(m,s)、噪声·比例因子Q2(m,s)应用上述的“MPEG4 AAC” 的SBR中的HF调整的增益限制器。

使用上述增益G2(m,i)、以及噪声·比例因子Q3(m,i),通过下式给出GTemp(m,i)、 QTemp(m,i),取代式89、90。

[式100]

GTemp(m,i+dh)=E0(m,i)·G2(m,i)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

[式101]

QTemp(m,i+dh)=E0(m,i)·Q3(m,i)

0≤m<M,t(s)≤i<t(s+1),0≤s<sE

进而,如果把式99置换为下式,则按照每个副频带B(T)k(FH(k)≤j<FH(k+1)), 针对高频带信号XH(j,i),以时间索引i为单位进行增益限制导致的能量损耗的补偿。

[式102]

GBoostTemp(k,i)=ϵ+Σj=FH(k)FH(k+1)-1E1(j,s)ϵ+Σj=FH(k)FH(k+1)-1(XH2(j,i)·G2(j,s)+S22(j,s)+δ(S2(j,s),s)·Q22(j,s))

G2(m,i)=GBoostTemp(k,i)·G(m,s)

Q3(m,i)=GBoostTemp(k,i)·Q2(m,s)

1≤k≤mH,FH(k)≤m+kx<FH(k+1),t(s)≤i<t(s+1),0≤s<sE

进而,当把式99置换为下式时,按照每个频率索引m,针对高频带信号XH(j,i) 以时间索引i为单位,进行增益限制导致的能量损耗的补偿。

[式103]

GBoostTemp(m,i)=ϵ+E1(m,s)ϵ+(XH2(m+kx,i)·G2(m,s)+S22(m,s)+δ(S2(m,s),s)·Q22(m,s))

G2(m,i)=GBoostTemp(m,i)·G(m,s)

Q3(m,i)=GBoostTemp(m,i)·Q2(m,s)

1≤k≤mH,0≤m<M,t(s)≤i<t(s+1),0≤s<sE

或者,在计算上述量GBoostTemp(m.i)时,也可以使用X’H(m+kx,i),取代XH(m+kx,i)。

在第2实施方式的语音解码装置101的时间/频率包络调整部1p中,时间/频率包 络的调整与第1实施方式的语音解码装置1的时间包络调整部1i相同地,使用从频 率包络叠加部1q接收到的量E(m,i),由与“MPEG4 AAC”的SBR中的HF调整(HF  Adjustment)类似的单元进行。因此,与“MPEG4 AAC”的SBR中的HF调整(HF  adjustment)同样地,在对增益、本底噪声比例因子、正弦波电平实施基于用于避免 不需要的噪声叠加的增益限制(增益限制器Gain limiter)、增益限制导致的能量损 耗的补偿(增益放大器Gain booster)的函数的处理的情况下,针对时间索引i(t (s)≤i<t(s+1))实施该处理。另一方面,根据本变形例,在对增益、本底噪声比例 因子、正弦波电平实施基于用于避免不需要的噪声叠加的增益限制(增益限制器 Gain limiter)、增益限制导致的能量损耗的补偿(增益放大器Gain booster)的函数 的处理的情况下,只要针对帧s实施该处理中的至少一个处理即可。因此,在本变形 例中,与第2实施方式的语音解码装置101相比,能够减少上述处理的运算量。

上述第2实施方式的语音解码装置101的第3变形例也能够应用于第2实施方式 的语音解码装置101的第1~第2变形例、以及第4实施方式的语音解码装置。

[第2实施方式的语音解码装置101的第3变形例的其它方式]

在上述变形例中,在应用第1实施方式的语音解码装置1的第1、第2、第3变 形例、以及至少执行一个以上的该变形例的处理的第1实施方式的语音解码装置1 的第5变形例的情况下,会产生时间包络计算部1g不计算时间包络ET(l,i)的情 况。在这种情况下,在需要E0(m,i)的运算处理中,将E0(m,i)置换为1并执 行。通过该方法,能够省略E0(m,i)、E0(m,i)的幂运算、乘以E0(m,i)的平 方根的处理,能够减少运算量。另外,在使用了上述方法的处理中,时间/频率包络 调整部1p无需计算E0(m,i)。

[第1实施方式的语音编码装置2的第6变形例]

时间包络信息计算部2f根据从频带分割滤波器组部2c取得的频域的信号X(j, i)、经由语音编码装置2的通信装置接收到的来自外部的输入信号、以及作为来自下 采样部2a的输出而得到的经过下采样的低频带的时域信号中的至少1个以上的信号 的特性,计算时间包络信息。作为上述信号的特性,例如有信号的过度性、调性、噪 声性等,但在本变形例中,信号特性不限于这些具体例。

本变形例也可以应用于第1实施方式的语音编码装置2的第1~第5变形例、以 及第2~第4实施方式的语音编码装置。

[第1实施方式的语音编码装置2的第7变形例]

时间包络计算控制信息生成部2j根据从频带分割滤波器组部2c得到的频域信号 X(j,i)、经由语音编码装置2的通信装置接收到的来自外部的输入信号、以及作为 来自下采样部2a的输出而得到的下采样的低频带时域信号中的至少1个以上的信号 的信号特性,生成与语音解码装置1中的低频带时间包络计算方法相关的时间包络计 算控制信息。作为上述信号的特性,例如有信号的过渡性、调性、噪声性等,但在本 变形例中,信号特性不限于这些具体例。

另外,本变形例也能够应用于第1实施方式的语音编码装置2的第1~第6变形 例以及第2~第4实施方式的语音编码装置。

[第1~第4实施方式的语音编码装置的量化/编码部]

关于第1~第4实施方式的语音编码装置的量化/编码部2g,显然可以对用于决 定是否附加本底噪声·比例因子、正弦波的参数也进行量化/编码。

工业上的可利用性

本发明的使用用途为语音解码装置、语音编码装置、语音解码方法、语音编码方 法、语音解码程序、以及语音编码程序,通过将解码信号中的时间包络调整为失真较 少的形状,能够得到前回声以及后回声得到充分改善的再现信号。

标号说明

1f1~1fn…低频带时间包络计算部、2e1~2en…低频带时间包络计算部、1,102, 201,301…语音解码装置、1a…解复用部、1b…低频带解码部、1c…频带分割滤波器 组部、1d…编码序列解析部、1e…逆量化部、1g…时间包络计算部、1h…高频带生成 部、1i…时间包络调整部、1j…频带合成滤波器组部、1k,1m,1n,1o…时间包络计 算控制部、1p,1v…时间/频率包络调整部、1q…频率包络叠加部、1r…编码序列解码 /逆量化部、1s…时间包络计算控制部、1t…包络调整部、1u…频率包络叠加部、1w… 频率包络计算部、2,102,202,302…语音编码装置、2a…下采样部、2b…低频带编 码部、2c…频带分割滤波器组部、2d…高频带生成用辅助信息计算部、2e1~2ek…低 频带时间包络计算部、2f…时间包络信息计算部、2g…量化/编码部、2h…高频带编码 序列构成部、2i…复用部、2j…时间包络计算控制信息生成部、2k…低频带解码部、 2m…频带合成滤波器组部、2n,2o,2p…频率包络信息计算部。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号