第一章 绪论
1.1 课题研究背景与意义
1.2 国内外研究现状与发展趋势
1.3 论文的研究内容和组织结构
第二章 强化学习与神经网络基础
2.1 强化学习基础理论
2.1.1 强化学习的原理和模型
2.1.2 马尔科夫决策过程模型
2.1.3 传统强化学习算法
2.2 神经网络理论
2.2.1 传统神经网络介绍
2.2.2 深度学习模型
2.3 深度强化学习算法
2.3.1 DQN算法介绍
2.3.2 DQN算法的改进
2.4 本章小结
第三章 PYNQ硬件平台介绍
3.1 PYNQ平台基本介绍
3.2 FPGA加速
3.3 AXI数据通信协议
3.4 Vivado HLS工具介绍
3.4.1 HLS工具基础介绍
3.4.2 HLS工具优化设计
3.5 本章小结
第四章 DQN算法加速方案设计
4.1 Q神经网络模型推导
4.1.1 推理阶段的推导
4.1.2 反向传播阶段的推导
4.2 DQN算法在PYNQ平台实现
4.2.1 DQN算法分析
4.2.2 使用HLS工具实现矩阵乘法及优化
4.2.3 使用HLS工具实现神经网络设计
4.3 本章小结
第五章 DQN算法加速方案实验验证
5.1 DQN算法运行环境搭建
5.1.1 硬件环境搭建
5.1.2 软件环境配置
5.2 DQN算法实现
5.3 实验结果讨论与改进
5.4 本章小结
第六章 总结与展望
致谢
参考文献
攻读硕士学位期间取得的成果