首页> 中文学位 >基于VQ模型和BP网络的高自然度语音转换
【6h】

基于VQ模型和BP网络的高自然度语音转换

代理获取

目录

文摘

英文文摘

论文说明:缩略语中英文对照表

声明

第一章绪论

1.1语音转换研究的意义

1.2语音转换的背景

1.3主要研究内容

第二章语音转换技术分析

2.1语音信号的基本特性

2.1.1语音信号的时域特性

2.1.2语音信号的频域特性

2.2语音的产生模型,个人特性及其相关参数

2.2.1语音产生模型

2.2.2语音的个人特性

2.2.3体现声音个人特性的声学特征参数

2.3语音转换算法分析

2.3.1语音频谱变换

2.3.2激励信号处理

2.3.3基频信息变换

2.3.4语音转换性能评价

2.4本章小结

第三章基于VQ算法的谱包络转换

3.1谱包络转换中的基本算法

3.1.1线性预测

3.1.2线谱频率

3.1.3矢量量化

3.2谱参数的转换

3.2.1谱参数的VQ模型训练

3.2.2谱参数转换的实现

3.3本章小结

第四章基于VQ算法的残差转换

4.1残差转换中的基本算法

4.1.1自相关函数的定义和性质

4.1.2短时自相关函数

4.1.3变形短时自相关函数

4.1.4循环互相关

4.2残差参数转换

4.2.1残差信号的模型训练

4.2.2转换的实现

4.3本章小结

第五章基于BP网络的基频曲线转换

5.1 BP网络原理

5.1.1前馈型神经网络

5.1.2 BP误差反向传播神经网络

5.1.3 BP学习算法

5.2基频的曲线转换

5.2.1相对基频曲线的BP网络训练

5.2.2转换的实现

5.3本章小结

第六章语音转换实验与分析

6.1转换系统处理流程

6.1.1训练流程

6.1.2转换流程

6.2谱包络、残差和韵律调整实验

6.2.1谱包络转换实验

6.2.2残差转换实验

6.2.3韵律调整实验

6.3语音转换实验

结论

参考文献

攻读硕士学位期间公开发表的论文

致谢

展开▼

摘要

说话人语音转换技术是把源说话人说的语音转换为像是目标说话人所说的语音的技术。说话人语音转换具有广泛的应用领域,比如文语转换(Text—to-Speech,TTS)系统、配音系统和保密通信等。本文提出了一种基于VQ模型与BP网络的高自然度语音转换方法。算法分为三个部分:前两部分用VQ模型实现了语音的谱包络及其激励的转换,第三部分采用BP算法实现语音的韵律转换规则建模。算法针对基音周期内残差波形的特点提出了循环互相关函数,有效地实现了残差波形聚类;针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音转换并得到高自然度合成语音。本文主要工作包括: (1)基于VQ模型实现了语音的谱包络转换。谱包络采用20阶LPC系数转换形成的线谱对频率系数LSF表示。相对于LPC参数,LSF具有更好的内插特性和量化特性。训练分别得到128个源语音的码向量和128个目标语音的码向量和由每一个源语音码向量到目标语音码向量的映射码书,映射码书就为目标语音向量的线性合成时的加权系数。转换后的语音的LSF系数更接近于目标说话人语音的LSF系数。 (2)基于VQ模型实现了其激励的转换。对残差的转换分为两阶段,一是残差能量的转换,采用线性转换的方法;二是对残差波形的转换,采用的方法是基于VQ码本映射的模型。在残差波形转换中,定义了循环互相关函数,并以最大互相关值的相反数作为波形间的距离测度。转换后的语音残差信号更多的保留了目标说话人的信息。 (3)采用BP算法实现语音的韵律变换规则建模。提取源说话人和目标说话人的相对基频曲线。用三层BP网络进行训练得到映射权值。在变换后的相对基频曲线加上目标语音的平均基频就得到转换后的基频曲线。算法针对汉语语音超音段发音特点进行韵律调整,有效实现了汉语语音变换并得到高自然度合成语音,实验表明是一种有效的汉语语音转换算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号