声明
第 1 章 绪论
1.1研究背景及意义
1.2国内外发展和研究现状
1.3论文主要研究内容及结构安排
第 2 章 深度学习与异构计算理论基础
2.1深度学习简介
2.1.1卷积神经网络
2.1.2池化
2.1.3激活函数
2.1.4全连接
2.1.5卷积神经网络经典网络模型
2.2异构计算
2.3高层次综合工具
2.3.1 OpenCL
2.3.2 Vivado HLS
2.4本章小结
第 3 章 神经网络在硬件上的实现
3.1.1 OpenCL
3.1.2 Xilinx ZYNQ
3.2存储访问优化
3.2.1共享内存的访问优化
3.2.2使用恒定高速缓存
3.2.3将数据预加载到本地内存
3.2.4传输带宽优化
3.2.5直接内存存取
3.3内核设计优化
3.3.1流水线设计
3.3.2去除循环依赖性
3.3.3循环展开
3.3.4减少代码复杂度
3.4面向硬件的结构优化
3.7本章小结
第 4 章 基于 OpenCL 的神经网络硬件加速器设计
4.1硬件平台搭建
4.1.1硬件平台介绍
4.1.2开发环境的搭建
4.2硬件加速器设计
4.2.1OpenCL主机(host)程序开发
4.2.2内核编写
4.3性能与分析
4.4本章小结
第 5 章 实验结果与分析
5.1实验平台搭建
5.2实验与方法
5.2.1 选用网络介绍
5.2.2硬件框架及内核设计
5.2.3执行步骤
5.2.4理论模型搭建
5.3性能与分析
5.4本章小结
第 6 章 总结与展望
参考文献
附录 攻读硕士期间发表的论文和专利
致 谢
湖南大学;