基于梯度奖励的深度强化学习移动机器人路径规划

喻凯旋; 林富生; 宋志峰; 余联庆

首页> 中文期刊>机床与液压 >基于梯度奖励的深度强化学习移动机器人路径规划

基于梯度奖励的深度强化学习移动机器人路径规划

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对目前深度强化学习移动机器人路径规划中稀疏奖励导致的效率低、收敛慢等问题,提出一种梯度奖励政策。使用区域分割将环境分割为缓冲区、探索区、临近区以及目标区,奖励的动态变化可以逐步缩小机器人的探索范围,同时在安全区域内也能获得正向奖励。首先输入机器人当前的位置坐标,经过神经网络后估计4个动作的Q值,随后通过去首动态贪婪策略达到最大化探索,最后采用基于均方误差的优先经验回放抽取样本进行梯度下降更新网络。实验结果表明:在小范围环境内探索效率可提升近40%,在大范围环境下成功率高于80%,而且在提高探索效率的同时增强了鲁棒性。

著录项

来源
《机床与液压》|2023年第17期|32-38|共7页
作者
喻凯旋; 林富生; 宋志峰; 余联庆;
展开▼
作者单位

武汉纺织大学机械工程与自动化学院;

三维纺织湖北省工程研究中心;

湖北省数字化纺织装备重点实验室;

展开▼
原文格式 PDF
正文语种 chi
中图分类机器人;
关键词
深度强化学习; 路径规划; 梯度奖励; 区域分割; 去首动态贪婪策略;
入库时间 2023-11-08 00:44:32

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的移动机器人动态路径规划算法 [J] . 张柏鑫 ,杨毅镔 ,朱华中 . 计算机测量与控制 . 2023,第1期
2. 基于深度强化学习的移动机器人路径规划优化 [J] . 罗国攀 ,张国良 ,李德胜 . 组合机床与自动化加工技术 . 2023,第4期
3. 基于深度强化学习和动态窗口法的移动机器人路径规划 [J] . 王鹏凯 ,梁中华 ,杨阔 . 计算机与数字工程 . 2021,第10期
4. 基于改进深度强化学习的移动机器人路径规划 [J] . 王军 ,杨云霄 ,李莉 . 电子测量技术 . 2021,第22期
5. 基于深度强化学习的移动机器人路径规划 [J] . DONG Yao ,GE Yingying ,GUO Hongyong . 计算机工程与应用 . 2019,第13期
6. 基于Q强化学习与CMAC的移动机器人局部路径规划 [C] . 王仲民 ,天津工程师范学院 ,岳宏 . 第二十四届中国控制会议 . 2005
7. 基于深度强化学习的移动机器人路径规划研究 [A] . 于效民 . 2022

基于梯度奖励的深度强化学习移动机器人路径规划

摘要

著录项

相似文献

相关主题

期刊订阅