基于改进深度强化学习的全局路径规划策略

韩玲; 张晖; 方若愚; 刘国鹏; 朱长盛; 迟瑞丰

首页> 中文期刊>汽车安全与节能学报 >基于改进深度强化学习的全局路径规划策略

基于改进深度强化学习的全局路径规划策略

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决模型过度依赖与过度估计的问题,提出一种基于传统深度强化学习(DRL)的抑制过度估计深度Q网络(SQDQN)算法,来建立全局路径规划策略。该SQDQN算法,结合深度Q网络(DQN)算法与信息熵,来抑制过度估计;借助信息熵,实时评估更新过程,来抑制DQN策略算法过度地估计损害性能;借助SQDQN算法与环境模型的交互作用,建立了获取全局路径规划策略的环境模型。结果表明:与DQN算法相比,SQDQN算法在20次实验中3次选择为更优策略;与Dijkstra传统路径规划方法相比,SQDQN算法所规划路程通行时间减少11.32%;本文的全局路径规划策略,减少了由于DQN对动作预期过高所导致的输出错误动作。

著录项

来源
《汽车安全与节能学报》|2023年第2期|202-211|共10页
作者
韩玲; 张晖; 方若愚; 刘国鹏; 朱长盛; 迟瑞丰;
展开▼
作者单位

长春工业大学机电工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类电气设备及附件;
关键词
智能交通; 路径规划; 深度强化学习(DRL); 信息熵; 抑制过度估计;

相似文献

中文文献
外文文献
专利

1. 基于改进深度强化学习的三维环境路径规划 [J] . 封硕 ,舒红 ,谢步庆 . 计算机应用与软件 . 2021,第001期
2. 基于改进深度强化学习的自动泊车路径规划 [J] . 陈鑫 ,兰凤崇 ,陈吉清 . 重庆理工大学学报（自然科学版） . 2021,第007期
3. 基于改进深度强化学习的自动泊车路径规划 [J] . 陈鑫 ,兰凤崇 ,陈吉清 . 重庆理工大学学报 . 2021,第007期
4. 基于变电站全局路径规划的蚁群算法的改进策略 [J] . 王鹏 ,郑敏 . 许昌学院学报 . 2021,第2期
5. 基于JPS策略的改进RRT*移动机器人全局路径规划算法 [J] . 马小陆 ,梅宏 ,王兵 . 中国惯性技术学报 . 2020,第6期
6. 基于改进蚁群算法的应急监测移动机器人全局路径规划 [C] . CHE Honglei ,车洪磊 ,WU Zongzhi . 第八届中国国际安全生产论坛 . 2016

基于改进深度强化学习的全局路径规划策略

摘要

著录项

相似文献

相关主题

期刊订阅