首页> 中文学位 >基于离散余弦变换的低速率波形内插语音编码算法研究
【6h】

基于离散余弦变换的低速率波形内插语音编码算法研究

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1引言

1.2语音编码的主要属性

1.2.1语音质量

1.2.2编码速率

1.2.3编解码复杂度

1.2.4编解码延时

1.2.5其他性能

1.3低速率语音编码

1.3.1多带激励编码模型

1.3.2混合激励线性预测编码模型

1.3.3正弦变换编码模型

1.3.4波形内插编码模型

1.4本文的研究范围及目标

1.5本文的组织和安排

第2章 波形内插语音编码

2.1背景概述

2.2原型波形内插

2.3特征波形内插

2.3.1特征波形

2.3.2特征波形的对齐

2.4传统特征波形分解方法

2.4.1低通滤波分解方法

2.4.2小波变换分解方法

2.4.3奇异值分解方法

2.4.4非负矩阵分解方法

2.5本章小结

第3章 基于离散余弦变换的特征波形分解方法

3.1背景概述

3.2离散余弦变换

3.3特征波形的离散余弦变换分解方法

3.3.1特征波形的等维处理

3.3.2特征波形的分类处理

3.3.3离散余弦变换分解方法

3.4离散余弦变换分解方法与传统分解方法性能比较

3.5本章小结

第4章 波形内插模型中对齐、相位问题研究

4.1背景介绍

4.2特征波形对齐问题的研究

4.3相位问题的研究及改进

4.3.1浊音帧相位

4.3.2清音帧相位

4.4.本章小结

第5章 基于离散余弦变换的特征波形量化方法

5.1概述

5.2特征波形的量化

5.2.1直流成分的量化

5.2.2低频成分的量化

5.2.3高频成分的量化

5.3本章小结

第6章DCT-WI声码器

6.1概述

6.2 DCT-WI编码器

6.2.1 2.0 kbps的DCT-WI编码器

6.2.2 1.6 kbps的DCT-WI编码器

6.3主观测试

6.4本章小结

总结及展望

参考文献

攻读硕士学位期间所发表论文

攻读硕士学位期间参加的科研项目

攻读硕士学位期间获奖情况

致谢

展开▼

摘要

本文基于波形内插(Waveform Interpolation,WI)模型,针对特征波形分解问题、特征波形对齐问题和相位问题作了重要改进: 在特征波形分解问题上,本文提出了基于离散余弦变换(Dsicrete Cosine Transform,DCT)的分解方法,将当前帧的特征波形分解为直流成分、低频成分和高频成分。与FIR低通滤波分解方法相比,该分解方法避免了传统方法的一帧额外延时,克服了分解后成分的不独立问题,保持了不引入分解偏差的优点,计算复杂度较FIR低通滤波方法下降了80%。在性能上,该方法也优于小波分解方法、奇异值分解方法和非负矩阵分解方法。该分解方法同时带来量化方面的优势,分解后的成分符合人耳感知特性,易于量化。同时,本文去除了传统WI声码器的对齐操作,使得编解码计算复杂度下降18%,实验结果表明,去掉对齐操作不影响重建语音质量。 在相位问题上,本文提出清/浊相位判决方法和浊音相位分类方法。在解码端,首先对当前语音帧进行清/浊判决,若判决当前帧为浊音帧,直流成分和低频成分添加固定相位,高频成分添加随机相位,且固定相位采用按基音周期分类的方法。若判决当前语音帧为清音帧,在添加相位时,直流成分、低频成分和高频成分都加入随机相位。实验表明,该方法能明显提升重建语音的听觉效果。 最后,本文提出了速率分别为2.0kbps和1.6kbps的DCT-WI语音编码器,并分别对其进行了MOS分测试。主观听觉表明,2.0kbps的DCT-WI声码器与2.4Kbps的MELP声码器具有一致的听觉效果,1.6kbps的DCT-WI声码器效果稍差于2.4kbps的MELP声码器。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号