第一章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.3 本文主要工作
1.4 论文章节安排
第二章 卷积神经网络与本文硬件加速系统设计
2.1 深度学习简介
2.1.1 基本概念
2.1.2 前向传播反向传播
2.2 卷积神经网络结构及模型
2.2.1 卷积神经网络的结构
2.2.2 卷积神经网络并行性
2.2.3 常见卷积神经网络模型
2.3 硬件加速技术
2.3.1 硬件加速平台简介
2.3.2 FPGA芯片结构及特点
2.3.3 硬件加速优化方法
2.4 本文卷积神经网络硬件加速系统设计
2.5 本章小结
第三章 卷积神经网络硬件结构设计
3.1 本文卷积神经网络模型
3.2 卷积神经网络硬件设计思路
3.3 卷积神经网络硬件结构设计
3.3.1 卷积层硬件设计
3.3.2 池化层硬件设计
3.3.3 激活函数硬件设计
3.3.4函数分类器硬件设计
3.3.5权值存储硬件设计
3.4 硬件优化设计
3.5 本章小结
第四章 基于ZYNQ的实时识别框架设计
4.1 图像采集及显示
4.2 数据存储结构设计
4.2.1 VDMA与DDR
4.2.2 视频时序控制模块
4.2.3 降采样模块与BRAM
4.3 实时识别框架系统实现
4.4 本章小结
第五章 硬件加速系统测试与验证
5.1 卷积神经网络各模块测试和验证
5.2 卷积网络模型权值训练
5.3 卷积神经网络硬件加速实时识别框架系统测试
5.4 本章小结
第六章 总结与展望
6.1 本文总结
6.2 工作展望
致谢
参考文献
附录
声明