首页> 中文学位 >基于特征波形内插算法的低速率语音编码系统的设计与实现
【6h】

基于特征波形内插算法的低速率语音编码系统的设计与实现

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1语音编码的背景与应用

1.2语音编码器的分类及属性

1.2.1语音编码器的编码方式

1.2.2语音编码器的基本属性

1.3低速率语音编码

1.3.1多带激励编码

1.3.2正弦变换编码

1.3.3混合激励线性预测编码

1.3.4波形内插编码

1.4本文的研究内容

1.4.1 WI编码器的特点

1.4.2 WI编码器的设计概述

1.5本文的结构安排

第2章波形内插语音编码

2.1 PWI基本原理及其性能分析

2.1.1 PWI的基本原理

2.1.2 PWI性能分析

2.2 CWI 原理

2.3 CWI的基本结构

2.3.1 CWI分析器的框架结构

2.3.2 CWI量化层结构

2.3.3 CWI编码器的合成器框架

2.4本文设计实现的CWI编码器结构

2.4.1编码器的比特分配

2.4.2合成分析层结构简介

2.4.3量化层的设计简介

2.5本章小结

第3章CWI编码器分析合成模块的设计与实现

3.1波形内插分析器的设计与仿真

3.1.1预处理

3.1.2线性预测分析模块

3.1.3基音检测模块

3.1.4特征波形的提取

3.1.5特征波形的表达

3.1.6特征波形的对齐

3.1.7特征波功率的归一化

3.2波形内插合成器的设计与仿真

3.2.1特征波形的功率去归一化

3.2.2瞬时基音及瞬时特征波形的内插

3.2.3二维特征波到一维残差信号的转换

3.2.4线性预测合成

3.3分析合成模块编码器的测试与性能评价

3.3.1主观A/B测试

3.3.2非正式MOS分测试

3.3.2重建语音的波形及语谱分析

3.4本章小结

第4章CWI编码器量化模块的设计与实现

4.1矢量量化器的设计

4.1.1 LBG算法

4.1.2初始码书的生成方法

4.1.3空胞腔和非典型胞腔的处理

4.1.4本文实现的矢量量化器

4.2 LSF参数的量化

4.2.1分裂矢量量化

4.2.2多级矢量量化

4.2.3预测分裂矢量量化

4.2.4本文采用的LSF量化方法及其实现

4.3基音周期的量化

4.4特征波形功率的量化

4.5特征波形的量化

4.5.1 CW的分解

4.5.2变维方法

4.5.3 REW量化

4.5.4 SEW量化

4.6本章小结

第5章 完整CWI编码器的测试分析与性能评价

5.1编码器的比特分配

5.2编码比特的封装与拆封

5.2.1比特封装

5.2.2比特拆封

5.2.3封装与拆封的测试

5.3编码器的波形及语谱分析

5.3.1原始语音波形与重建语音波形比较

5.3.2原始语音与重建语音的语谱图比较

5.4语音质量的评价方法

5.4.1客观语音质量评价方法

5.4.2主观语音质量评价方法

5.5本章小结

第6章结论与展望

6.1本文总结

6.2下一步工作展望

致谢

攻读硕士期间发表的论文

参考文献

展开▼

摘要

近年来,低速率语音编码技术发展迅速,出现了多种成功的编码算法,如多带激励编码器、混合激励线性预测编码器、正弦交换编码器和波形内插编码器等.而在2.4kb/s编码速率上,波形内插编码器在正式的测试中获得了几乎最好的评价,并且已经成为研究的热点。 本文选择了波形内插(WI-Waveform Interpolation)编码方案作为设计低速率语音编码器的模型,基于C语言高效、快速、灵活及便于移植等特性,本文使用C语言实现整个编码器,以G.729共轭结构一代数码激励线性预测(CS-ACELP-Conjugate Structure Algebraic Code Excited Linear Prediction)、自适应多速率(AMR-Adaptive Multi-Rate)等语音编码标准为设计参考,最终实现了高效的2.4kb/s波形内插语音编码器,具有较好的语音质量。 本文首先对波形编码技术的研究进展情况进行了简要介绍,并以W.B.Kleijn提出的特征波形内插(CWI-Characteristic Waveform Interpolation)编码器为模型,对编码器的原理和特点进行了深入的分析和研究。然后本文参考现有CWI编码模型,结合当前的编码技术,设计并实现了改进的2.4kb/s的CWI编码方案。为了便于进行数据分析和算法验证,编码器的设计将分析合成模块和量化模块层分开实现,并且每个功能模块的设计都在MATLAB中进行了仿真测试,给出了相应的仿真结果和图示说明. 对于2.4kb/s的波形内插编码器来说,重建语音的质量取决于参数的量化效果,而与编码模型几乎无关.由于线谱频率(LSF-Line Spectrum Frequency)参数、慢渐进波形(SEW-Slowly EvolvingWaveform)和快渐进波形(REW-Rapidly Evolving Waveform)的幅度谱,甚至特征波形的功率都要进行矢量量化,因此矢量量化器设计和码书的训练是本文研究的重点对象。本文在第4章给出了基于LBG算法的矢量量化器的设计,为了方便各种不同参数进行量化时调用,将整个码书训练的流程编写为通用的C语言库函数形式.在进行LSF参数和特征波形功率量化过程中,为了降低复杂度和减小存储空间,本文采用了分裂和分级的思想;由于SEW和REW幅度谱都是变维矢量,本文采用变维矢量量化(VDVQ-Variable Dimension Vector Quantization)方法将其转换为定维矢量,再进行码书训练或者使用矢量量化器进行编码。 本文在第5章给出了2.4kb/s的CWI编码器的分析测试和性能评价。由于编码比特存放在二进制文件中,因此本文给出了详细的编码比特的封装和拆封流程的设计,并对将编码前的参数索引值和解码生成的参数索引值进行比较,通过测试验证了比特封装和拆封的准确性。最后通过非正式的平均意见得分(MOS-Mean Opinion Score)测试、判断韵字测试(DRT-Diagnostic Rhyme Test)等主观测试方法对重建语音质量进行了主观评价,测试结果表明重建语音的质量可以达到通信质量,编码效果与2.4kb/s的混合激励线性预测(MELP-Mixed Excitation Linear Prediction)编码器相当。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号