声明
摘要
表格索引
插图索引
算法索引
主要符号对照表
第一章 绪论
1.1 研究背景及意义
1.2 深度学习研究现状
1.3 深度神经网络简介
1.3.1 网络结构
1.3.2 后向传播算法
1.4 递归神经网络简介
1.4.1 网络结构
1.4.2 时域后向传播算法
1.5 长短时记忆元递归神经网络
1.5.1 LSTM结构
1.5.2 后向传播
1.6 深度学习模型在大词汇量连续语音识别中的应用
1.7 序列标注的连接时序分类训练
1.7.1 相关概念
1.7.2 前后向算法
1.7.3 模型训练
1.7.4 解码算法
1.8 本文主要工作
1.9 本文结构安排
第二章 基于样本分离边距的最小分类误差准则在深度神经网络训练中的应用
2.1 引言
2.2 ReLU-DNN在模式分类问题中的应用
2.3 交叉熵准则
2.4 最小分类误差准则
2.5 基于样本分离边距的最小分类误差准则
2.6 实验结果
2.6.1 实验设置
2.6.2 手写识别实验结果
2.7 本章小结
第三章 长短时记忆元递归神经网络的一种快速训练算法
3.1 引言
3.2 递归神经网络训练算法回顾
3.2.1 BPTT(∞)算法
3.2.2 BPTT(h)算法
3.2.3 BPTT(h,h’)算法
3.2.4 Epoch-wise BPTT算法
3.2.5 RTRL算法
3.3 基于上下文敏感区块的BPTT算法
3.3.1 上下文敏感区块定义
3.3.2 训练算法
3.3.3 解码算法
3.4 其他研究组的相关后续工作
3.5 实验结果
3.5.1 手写识别任务
3.5.2 大词汇量连续语音识别任务
3.6 本章小结
第四章 深度学习模型的数据并行训练算法
4.1 引言
4.2 相关工作
4.2.1 异步随机梯度下降算法
4.2.2 模型平均算法
4.2.3 1-bit SGD
4.3 数据并行增量块训练框架
4.4 基于ADMM的IBT算法
4.4.1 ADMM算法的一般形式
4.4.2 全局一致问题的ADMM求解算法
4.4.3 基于ADMM的深度学习模型训练IBT算法
4.5 基于数据并行优化和BMUF的IBT算法
4.5.1 MA算法与SGD算法比较
4.5.2 逐区块模型更新滤波技术
4.5.3 BMUF算法技术原理
4.5.4 BMUF算法训练参数设置准则
4.6 训练系统实现
4.6.1 实验平台
4.6.2 实现细节
4.7 实验结果
4.7.1 实验数据集
4.7.2 基于ADMM的分布式IBT算法实验结果
4.7.3 基于数据并行优化和BMUF的IBT算法
4.8 本章小结
第五章 总结和展望
5.1 本文研究重点回顾
5.2 研究工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果