首页> 中文学位 >基于深度强化学习的自动驾驶决策方法研究
【6h】

基于深度强化学习的自动驾驶决策方法研究

代理获取

目录

声明

致谢

1 绪论

1.1 研究意义

1.2 自动驾驶研究现状

1.2.1 国外自动驾驶研究现状

1.2.2 国内自动驾驶研究现状

1.2.3 存在的问题

1.3 本文主要工作

1.4 章节安排

2 强化学习算法

2.1 引言

2.2 马尔科夫决策过程

2.3 强化学习理论基础

2.3.1 强化学习原理

2.3.2 强化学习分类

2.4 强化学习经典算法

2.4.1 Q学习算法

2.4.2 SARSA算法

2.5 本章小结

3 深度强化学习

3.1 引言

3.2 深度Q网络算法

3.2.1 深度Q网络算法原理

3.2.2 深度Q网络算法目标网络

3.2.3 深度Q网络算法经验池

3.3 基于策略梯度的强化学习方法

3.3.1 蒙特卡洛梯度方法

3.3.2 行动者-评论家算法

3.4 确定性策略梯度算法分析

3.5 深度确定性策略梯度算法分析

3.6 软行动者-评论家算法分析

3.6.1 最大熵

3.6.2 软更新

3.6.3 双网络结构

3.7 本章小节

4 基于深度强化学习的自动驾驶仿真实验

4.1 引言

4.2 仿真平台

4.3 基于DDPG算法的自动驾驶仿真实验

4.3.1 算法网络结构

4.3.2 奖赏函数设计

4.3.3 探索噪声设计

4.3.4 算法训练

4.3.5 实验结果与分析

4.4 基于SAC算法的自动驾驶仿真实验

4.4.1 SAC算法网络结构

4.4.2 SAC算法训练及其结果分析

4.4.3 经验池的改进

4.4.4 实验结果与分析

4.5 本文算法与经典算法的实验对比分析

4.6 本章小节

5 总结和展望

5.1 结论

5.2 展望

参考文献

作者简历及攻读硕士/博士学位期间取得的研究成果

独创性声明

学位论文数据集

展开▼

著录项

  • 作者

    庞可;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 工程
  • 授予学位 硕士
  • 导师姓名 张严心;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号