首页> 中文学位 >基于深度强化学习的自动驾驶决策方法研究

【6h】

基于深度强化学习的自动驾驶决策方法研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

致谢

1 绪论

1.1 研究意义

1.2 自动驾驶研究现状

1.2.1 国外自动驾驶研究现状

1.2.2 国内自动驾驶研究现状

1.2.3 存在的问题

1.3 本文主要工作

1.4 章节安排

2 强化学习算法

2.1 引言

2.2 马尔科夫决策过程

2.3 强化学习理论基础

2.3.1 强化学习原理

2.3.2 强化学习分类

2.4 强化学习经典算法

2.4.1 Q学习算法

2.4.2 SARSA算法

2.5 本章小结

3 深度强化学习

3.1 引言

3.2 深度Q网络算法

3.2.1 深度Q网络算法原理

3.2.2 深度Q网络算法目标网络

3.2.3 深度Q网络算法经验池

3.3 基于策略梯度的强化学习方法

3.3.1 蒙特卡洛梯度方法

3.3.2 行动者-评论家算法

3.4 确定性策略梯度算法分析

3.5 深度确定性策略梯度算法分析

3.6 软行动者-评论家算法分析

3.6.1 最大熵

3.6.2 软更新

3.6.3 双网络结构

3.7 本章小节

4 基于深度强化学习的自动驾驶仿真实验

4.1 引言

4.2 仿真平台

4.3 基于DDPG算法的自动驾驶仿真实验

4.3.1 算法网络结构

4.3.2 奖赏函数设计

4.3.3 探索噪声设计

4.3.4 算法训练

4.3.5 实验结果与分析

4.4 基于SAC算法的自动驾驶仿真实验

4.4.1 SAC算法网络结构

4.4.2 SAC算法训练及其结果分析

4.4.3 经验池的改进

4.4.4 实验结果与分析

4.5 本文算法与经典算法的实验对比分析

4.6 本章小节

5 总结和展望

5.1 结论

5.2 展望

参考文献

作者简历及攻读硕士/博士学位期间取得的研究成果

独创性声明

学位论文数据集

展开▼

著录项

作者
庞可;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科工程
授予学位硕士
导师姓名张严心;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的单目视觉自动驾驶决策系统 [J] . 杨明珠 . 自动化博览 . 2020,第005期
2. 基于动作约束深度强化学习的安全自动驾驶方法 [J] . 代珊珊 ,刘全 . 计算机科学 . 2021,第009期
3. 基于深度强化学习的自动驾驶车控制算法研究 [J] . 王丙琛 ,司怀伟 ,谭国真 . 郑州大学学报（工学版） . 2020,第004期
4. 基于深度强化学习的自动驾驶研究 [J] . 刘偲 . 自动化应用 . 2020,第005期
5. 基于深度强化学习的自动驾驶策略学习方法 [J] . 夏伟 ,李慧云 . 集成技术 . 2017,第003期
6. 鲁棒自动驾驶仪设计:基于仿真和多准则决策 [C] . 陈晓波 ,刘恒军 . '2007系统仿真技术及其应用学术研讨会 . 2007
7. 基于深度强化学习的网联自动驾驶车辆决策控制方法 [A] . 白正伟 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号