DDPG优化算法的机械臂轨迹规划

张浩博; 仲志丹; 乔栋豪; 赵耀; 杨遨宇

首页> 中文期刊>组合机床与自动化加工技术 >DDPG优化算法的机械臂轨迹规划

DDPG优化算法的机械臂轨迹规划

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)在机械臂轨迹规划中学习效率低、规划时间长的问题,提出了一种基于SumTree数据结构的加权采样DDPG算法.首先,对Q-learning的动作价值函数进行优化并引入OU随机噪声模型;其次,对经验池中的样本添加一个优先权,优先权大的样本有更大的概率被采样出来进行训练,从而提高样本的利用率;最后,基于ROS平台搭建虚拟机器臂的实验环境进行仿真.实验结果表明,在优化后的DDPG算法下,智能机械臂达到最大累积奖励时间提前了53.8％,学习效率提高了一倍以上,明显优于传统的DDPG算法.

著录项

来源
《组合机床与自动化加工技术》|2021年第12期|37-40|共4页
作者
张浩博; 仲志丹; 乔栋豪; 赵耀; 杨遨宇;
展开▼
作者单位

河南科技大学机电工程学院河南洛阳 471003;

河南科技大学机电工程学院河南洛阳 471003;

河南科技大学机电工程学院河南洛阳 471003;

河南科技大学机电工程学院河南洛阳 471003;

河南科技大学机电工程学院河南洛阳 471003;

展开▼
原文格式 PDF
正文语种 chi
中图分类柔性制造系统及柔性制造单元;程序控制机床、数控机床及其加工;
关键词
深度确定性策略梯度; 轨迹规划; 加权采样; 优先权;
入库时间 2023-07-25 09:23:21

相似文献

中文文献
外文文献
专利

1. 基于遗传优化算法的柔性机械臂抑振轨迹规划研究 [J] . 娄军强 ,魏燕定 ,李国平 . 振动与冲击 . 2016,第011期
2. 基于混沌粒子群优化算法的空间机械臂轨迹规划算法 [J] . 夏红伟 ,翟彦斌 ,马广程 . 中国惯性技术学报 . 2014,第002期
3. 改进的DDPG对话策略优化算法 [J] . 赵崟江 ,李艳玲 ,林民 . 计算机工程与设计 . 2021,第002期
4. 基于ROS平台的六自由度机械臂轨迹规划及仿真研究 [J] . 刘宇程 ,姜振华 ,胡俊 . 制造业自动化 . 2022,第1期
5. 基于精准碰撞检测算法的机械臂避障轨迹规划 [J] . 王坤 ,张志飞 ,赵才 . 人工智能与机器人研究 . 2021,第002期
6. 机械臂的轨迹规划与协调控制模型及仿真研究 [C] . 崔福霞 . 2017年西南三省一市（贵州、重庆、四川、云南）自动化与仪器仪表学术年会 . 2017
7. 基于正逆运动学分析的机械臂时间最优轨迹规划研究 [A] . 程浩田 . 2021

DDPG优化算法的机械臂轨迹规划

摘要

著录项

相似文献

相关主题

期刊订阅