声明
摘要
插图
表格
第一章 绪论
1.1 说话人转换的定义
1.2 说话人转换的意义
1.2.1 理论研究意义
1.2.2 实际应用意义
1.3 说话人转换技术的研究历史与现状
1.4 本论文的研究目标和内容概述
第二章 说话人转换系统介绍
2.1 说话人的个性特征
2.1.1 语音产生过程
2.1.2 影响说话人的个性特征的本质因素
2.2 典型的说话人转换系统
2.2.1 系统构成
2.2.2 语音分析与合成
2.2.3 特征对齐
2.2.4 特征转换
2.3 基于GMM的频谱转换方法
2.3.1 高斯混合模型
2.3.2 基于最小均方误差准则的方法
2.3.3 最大后验概率模型训练方法
2.3.4 基于最大输出概率的转换方法
2.3.5 说话人转换方法的评价方法
2.4 本文的出发点
2.5 本章小结
第三章 融合独立转换函数的联合空间频谱建模与转换
3.1 并行数据上的模型训练与转换
3.1.1 模型训练
3.1.2 实验及分析
3.1.3 小结
3.2 非并行数据上的模型训练与转换
3.2.1 模型训练
3.2.2 基于频率弯折的性能改善
3.2.3 实验及分析
3.2.4 小结
3.3 动态特征提取窗系数的研究
3.3.1 实验及分析
3.3.2 小结
3.4 本章小结
第四章 基于说话人信息与内容信息分别建模的转换方法
4.1 基于话者无关空间的建模转换方法
4.1.1 说话人无关模型
4.1.2 使用话者无关模型构造说话人转换系统
4.1.3 实验及分析
4.1.4 小结
4.2 基于深层神经网络的说话人与内容分离及其在说话人转换中的应用
4.2.1 深层神经网络
4.2.2 深层神经网络的初始化
4.2.3 深层置信网络
4.2.4 堆叠的自动编码器
4.2.5 说话人信息和内容信息分离的网络
4.2.6 小结
4.3 本章小结
第五章 基于受限玻尔兹曼机的频谱建模与转换
5.1 受限波尔兹曼机
5.1.1 模型介绍
5.1.2 模型训练
5.1.3 模型评估
5.1.4 RBM的模式
5.2 RBM在声学特征上的建模能力
5.3 RBM在说话人转换中的应用
5.3.1 实验及分析
5.4 本章小结
第六章 总结
6.1 本文的主要贡献与创新点
6.2 后续的研究工作
参考文献
在读期间发表的学术论文与取得的研究成果
致谢