首页> 中文学位 >面向强化学习的FPGA硬件加速平台的研究
【6h】

面向强化学习的FPGA硬件加速平台的研究

代理获取

目录

第一章 绪论

1.1 课题研究背景与意义

1.2 国内外研究现状与发展趋势

1.3 论文的研究内容和组织结构

第二章 强化学习与神经网络基础

2.1 强化学习基础理论

2.1.1 强化学习的原理和模型

2.1.2 马尔科夫决策过程模型

2.1.3 传统强化学习算法

2.2 神经网络理论

2.2.1 传统神经网络介绍

2.2.2 深度学习模型

2.3 深度强化学习算法

2.3.1 DQN算法介绍

2.3.2 DQN算法的改进

2.4 本章小结

第三章 PYNQ硬件平台介绍

3.1 PYNQ平台基本介绍

3.2 FPGA加速

3.3 AXI数据通信协议

3.4 Vivado HLS工具介绍

3.4.1 HLS工具基础介绍

3.4.2 HLS工具优化设计

3.5 本章小结

第四章 DQN算法加速方案设计

4.1 Q神经网络模型推导

4.1.1 推理阶段的推导

4.1.2 反向传播阶段的推导

4.2 DQN算法在PYNQ平台实现

4.2.1 DQN算法分析

4.2.2 使用HLS工具实现矩阵乘法及优化

4.2.3 使用HLS工具实现神经网络设计

4.3 本章小结

第五章 DQN算法加速方案实验验证

5.1 DQN算法运行环境搭建

5.1.1 硬件环境搭建

5.1.2 软件环境配置

5.2 DQN算法实现

5.3 实验结果讨论与改进

5.4 本章小结

第六章 总结与展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

著录项

  • 作者

    秦亮;

  • 作者单位

    电子科技大学;

  • 授予单位 电子科技大学;
  • 学科 微电子学与固体电子学
  • 授予学位 硕士
  • 导师姓名 阮爱武;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    强化学习; FPGA硬件; 加速;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号