首页> 中文学位 >探索增强深度强化学习方法研究
【6h】

探索增强深度强化学习方法研究

代理获取

目录

声明

致谢

变量注释表

1 绪论

1.1 研究背景及意义(Research Background and Significance)

1.2 国内外研究现状(Research Actuality)

1.3 研究目标及内容(Research Objectives and Contents)

1.4 论文章节安排(Thesis Chapter Arrangement)

2 相关工作

2.1 马尔科夫决策过程(Markov Decision Process)

2.2 基 于 值 函 数 的 深 度 强 化 学 习 ( Value-Based Deep Reinforcement Learning)

2.3 基于策略的深度强化学习(Policy-Based Deep Reinforcement Learning)

2.4 深度强化学习面临的挑战(Challenges of Deep Reinforcement Learning)

2.5 本章小结(Conclusions of the Chapter)

3 基于推断的后验参数分布优化

3.1 研究背景(Research Background)

3.2 基于推断的后验参数分布优化( Inference-Based Posteriori Parameter Distribution Optimization)

3.3 实验结果与分析(Experimental Results and Analysis)

3.4 本章小结(Conclusions of the Chapter)

4 近端参数分布优化

4.1 研究背景(Research Background)

4.2 近端参数分布优化( Proximal Parameter Distribution Optimization)

4.3 实验结果与分析(Experimental Results and Analysis)

4.4 本章小结(Conclusions of the Chapter)

5 基于演示的策略优化

5.1 研究背景(Research Background)

5.2 基 于 演 示 的 策 略 优 化 ( Demonstration-Based Policy Optimization)

5.3 实验结果与分析(Experimental Results and Analysis)

5.4 本章小结(Conclusions of the Chapter)

6 基于演示的内部回报机制

6.1 研究背景(Research Background)

6.2 基于演示的内部回报机制( Demonstration-Based Internal Reward Mechanism)

6.3 实验结果与分析(Experimental Results and Analysis)

6.4 本章小结(Conclusions of the Chapter)

7 总结与展望

7.1 总结(Conclusions)

7.2 展望(Prospects)

参考文献

作者简历

学位论文数据集

展开▼

著录项

  • 作者

    李天一;

  • 作者单位

    中国矿业大学中国矿业大学(江苏);

  • 授予单位 中国矿业大学中国矿业大学(江苏);
  • 学科 控制科学与工程
  • 授予学位 硕士
  • 导师姓名 王雪松;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

  • 入库时间 2022-08-17 11:22:21

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号