首页> 中文学位 >超宽带嵌入式语音与音频编码研究
【6h】

超宽带嵌入式语音与音频编码研究

代理获取

目录

文摘

英文文摘

项目基金资助

图例

表例

第1章 绪论

1.1 引言

1.2 语音与音频编码基础

1.2.1 人耳听觉特性

1.2.2 语音频编码方法分类

1.3 语音频编码器的基本属性

1.3.1 带宽

1.3.2 编码速率

1.3.3 语音频编码质量

1.3.4 延时和算法复杂度

1.4 语音频编码的发展

1.4.1 语音编码技术发展

1.4.2 音频编码技术发展

1.5 嵌入式语音频编码技术及标准化现状

1.6 本文的主要研究内容

1.7 本文的组织安排

第2章 嵌入式语音频编码研究概述

2.1 引言

2.2 嵌入式语音频编码技术研究进展

2.2.1 基于小波变换的嵌入式编码算法

2.2.2 基于正弦模型的嵌入式编码算法

2.2.3 可分级无损音频压缩算法

2.2.4 以ACELP为核心层的嵌入式编码算法

2.3 一种G.EV-VBR宽带嵌入式编码候选方法

2.3.1 编码器主要过程

2.3.2 解码处理

2.3.3 比特分配和比特流形式

2.3.4 编码器算法延时

2.3.5 编码器性能评价

2.4 G.EV-VBR超宽带嵌入式编码提案

2.4.1 G.729.1标准描述

2.4.2 基于G.729.1核心编码器的超宽带层构架

2.5 本章结论

第3章 基于阶乘脉冲编码的带宽升级编码算法

3.1 引言

3.2 阶乘脉冲编码概述

3.3 基于FPC的嵌入式编码器

3.3.1 高频信息提取

3.3.2 G.729.1编码残差提取

3.3.3 频域系数的FPC编码

3.3.4 码流结构

3.3.5 解码操作

3.4 编码质量评测

3.5 本章结论

第4章 基于MLT变换编码的嵌入式编码算法

4.1 引言

4.2 嵌入式MLT变换编码算法

4.2.1 时-频变换与子带包络编码

4.2.2 子带感知重要性排序

4.2.3 编码分类程序

4.2.4 MLT系数细节信息编码

4.2.5 码流结构

4.3 嵌入式MLT变换解码算法

4.3.1 解码总述

4.3.2 幅度包络解码

4.3.3 解码分类程序

4.3.4 全码流下MLT系数细节信息解码

4.3.5 分层码流MLT系数解码

4.3.6 时-频反变换

4.3.7 性能评测

4.4 基于嵌入式MLT变换的超宽带编码器

4.4.1 编码流程

4.4.2 解码流程

4.4.3 质量评测

4.5 本章结论

第5章 基于位平面分层和SQVH的嵌入式编码方法

5.1 概述

5.2 比特平面编码简介

5.3 编码算法描述

5.3.1 时-频转换和位平面分层

5.3.2 MLT域绝对听觉掩蔽分析

5.3.3 40、48kb/s码率层嵌入式SQVH编码

5.3.4 64kb/s码率层的位平面编码

5.3.5 高频重建技术

5.3.6 G.729.1宽带质量增强处理

5.3.7 码流结构

5.4 解码算法描述

5.4.1 G.729.1解码操作

5.4.2 超宽带全码率解码

5.4.3 谱熵分类的线性恢复技术

5.4.4 G.729.1残差的解码处理

5.4.5 帧擦除隐藏

5.5 性能评测

5.5.1 系统延时

5.5.2 主客观质量评测

5.6 本章结论

第6章 嵌入式立体声编码算法

6.1 引言

6.2 主成分分析方法

6.2.1 主成分分析简介

6.2.2 基于PCA的MLT系数压缩采样方法

6.3 基于M/S的嵌入式立体声编码方法

6.3.1 宽带立体声编解码算泫

6.3.2 超宽带立体声信号编解码算法

6.3.3 质量评测

6.4 PCA降维分析的嵌入式立体声编码方法

6.4.1 编码参数模型

6.4.2 基于PCA的嵌入式立体声编码

6.5 本章结论

第7章 嵌入式超宽带编码器的性能评估

7.1 概述

7.2 评测条件

7.3 数据分析

7.4 测试结果

7.4.1 实验1测试结果

7.4.2 实验2测试结果

7.5 测试结论

第8章 全文总结与展望

8.1 论文工作总结

8.2 论文的主要创新点

8.3 工作展望

参考文献

附录

附录:NWT、BT、EQUIVALENT假设检验证明

攻读博士学位期间取得的科研成果

攻读博士学位期间参加的科研项目和获奖情况

致谢

展开▼

摘要

随着网络通信、移动通信和网络在线音频技术的快速发展,传统的固定速率语音与音频编码由于编码模型的限制,并不适用于时变的通信信道。嵌入式编码作为变速率编码的一种,可以很好地应对这些问题,因此它逐渐成为了现阶段语音频编码研究的热点问题。
   基于此背景,2005年ITU-T第16工作组提出了G.EV-VBR嵌入式宽带编码提案,并于2007年7月对其功能进行扩展,提出了一个以G.729.1和G.EV-VBR为核心的超宽带编码提案,目前多家研究机构参与了该项标准的竞争。
   本文正是针对此标准的制定展开工作,通过对现有的编码技术进行深入研究,提出了几种嵌入式的语音频编码算法,并最终实现了一套满足ITU-T指标要求的8~64kb/s超宽带嵌入式编码算法。
   本文的主要成果体现为如下几个方面:
   1.研究现有的嵌入式编码技术,提出了一种以G.729.1为核心编码器的超宽带嵌入式编码结构;
   2.将用于散布脉冲位置编码的阶乘脉冲编码技术引入频域系数编码中,通过量化由MLT系数构成的低维矢量,实现了一种带宽升级的嵌入式编码算法;
   3.为了进一步优化编码比特分配,提高量化效率,提出了基于人耳绝对听觉掩蔽特性的感知排序方法,用以控制编码比特的分配和码流的分层,从而实现一种量化精度升级的超宽带嵌入式编码方法,该方法保证了新增码率下解码信号的有效带宽均为14kHz;
   4.针对低码率下丢失谱线的恢复问题,提出了一种基于修正谱熵分类的频谱线性插值方法,本方法可根据谱信息将信号分为类噪声和类谐波两类,不同类型信号选取不同的插值函数和衰减因子来恢复丢失的频域系数,对于类噪声信号本方法可有效地保证其高频谱能量的平滑,同时,对于类谐波信号可避免出现因系数填充不当而引入量化噪声的情况;
   5.基于位平面分层和矢量哈夫曼编码技术,提出了一种量化精度升级的嵌入式编码算法,本套算法分层方法灵活,可根据实际码率要求结合人耳听觉模型自适应地进行位平面分层量化。该方法经ITU-T认证的北京理工大学通信技术研究所进行标准化评测,测试结果表明,在各码率下的编码质量均达到了ITU-T提出的指标要求;
   6.采用M/S技术和嵌入式MLT变换编码技术,提出了一种嵌入式的立体声编码算法,本方法在各码率下对立体声信号的编码质量均不次于ITU-T给定的参考编码器,尤其是对于左、右声道具有较强相关性的立体声信号,编码效果尤
   7.对主成分分析方洼进行研究,提出了一种MLT系数压缩采样方法,实现了数据降维后信号的主观无失真重建,同时结合此方法提出了一种嵌入式立体声参数编码方法。该编码方法有效地保留了立体声信号的空间感知特性,对于左右声道相关性较弱的立体声信号具有非常好的编码质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号