声明
摘要
插图
表格
算法
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文主要研究内容及结构安排
第二章 基于多GPU的DNN快速训练
2.1 引言
2.2 GPU及在DNN建模中的应用
2.2.1 GPU和CUDA C编程模型
2.2.2 GPU下DNN训练相关工具
2.3 DNN-HMM声学建模
2.3.1 RBM和DBN训练算法
2.3.2 DNN训练算法
2.3.3 DNN-HMM模型
2.4 多GPU加速DNN训练
2.4.1 RBM算法的矩阵表示
2.4.2 基于CUDA C的RBM算法优化实现
2.4.3 多GPU下的预训练
2.5 实验部分
2.5.1 实验配置
2.5.2 实验结果和分析
2.6 本章小结
第三章 基于说话人编码的自适应建模
3.1 引言
3.2 基于说话人编码的模型域自适应
3.2.1 说话人编码自适应模型
3.2.2 交叉熵准则下的自适应训练
3.3 i-Vector表征说话人特性编码方式
3.4 实验部分
3.4.1 TIMIT任务
3.4.2 Switchboard任务
3.5 本章小结
第四章 说话人相关声学模型的区分性训练
4.1 引言
4.2 DNN的区分性训练
4.2.1 区分性训练简介
4.2.2 基于MMI准则的DNN区分性训练
4.3 基于MMI准则的说话人编码自适应
4.4 说话人相关DNN的区分性训练
4.5 实验部分
4.5.1 MMI准则下说话人编码自适应
4.5.2 说话人相关DNN的帧级交叉熵训练
4.5.3 说话人相关DNN的区分性训练
4.6 本章小结
第五章 基于DNN-HMM的其它说话人自适应方法
5.1 引言
5.2 矩阵分解说话人自适应
5.2.1 SVD及其在DNN中的应用
5.2.2 基于SVD的说话人自适应方法
5.3 矩阵分解说话人自适应实验
5.3.1 TIMIT任务
5.3.2 Switchboard任务
5.4 基于融合的说话人自适应
5.4.1 说话人编码自适应中存在的问题
5.4.2 基于融合的说话人自适应方法
5.5 基于融合的自适应实验结果
5.6 本章小结
第六章 总结
6.1 本文的主要贡献与创新点
6.2 后续工作展望
参考文献
个人简历及在读期间发表的学术论文
致谢