基于改进Q学习的机械臂实时障碍规避方法

吴戴燕; 刘世林

首页> 中文期刊> 《台州学院学报》 >基于改进Q学习的机械臂实时障碍规避方法

基于改进Q学习的机械臂实时障碍规避方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了提高实时机械臂规避障碍物的适应性,提出一种基于改进Q学习的控制规避方法。首先,利用深度增强学习对机械臂动作给予奖励和惩罚,并通过深度神经网络学习特征表示。然后,采用状态和动作集合以及环境迁移概率矩阵定义马尔科夫决策过程;同时,将归一化优势函数与Q学习算法相结合,以支持在连续空间中定义的机器人系统。实验结果表明:所提方法解决了Q学习收敛速度慢的缺点,实现了高性能机械臂的实时避障,有助于实现人机安全共存。

著录项

来源
《台州学院学报》 |2022年第6期|13-20|共8页
作者
吴戴燕; 刘世林;
展开▼
作者单位

安徽六安技师学院机电工程系;

安徽工程大学电子工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类中等教育;
关键词
机械臂; 马尔科夫决策; 深度增强学习; Q学习; 归一化优势函数;

相似文献

中文文献
外文文献
专利

1. 针对动态障碍物的7R机械臂实时避障方法 [J] . 赵京 ,李世龙 ,龚世秋 . 北京工业大学学报 . 2022,第11期
2. 基于改进型YOLOv4的果园障碍物实时检测方法 [J] . 蔡舒平 ,孙仲鸣 ,刘慧 . 农业工程学报 . 2021,第002期
3. 基于改进的速度障碍法的有人/无人机协同系统三维实时避障方法 [J] . 李樾 ,韩维 ,陈清阳 . 西北工业大学学报 . 2020,第002期
4. 基于动态系统的多障碍实时规避算法 [J] . 王伟光 ,尹健 ,钱祥利 . 计算机科学 . 2020,第0z2期
5. 基于改进深度学习算法的区域实时定位方法研究 [J] . 江春 . 中国电子科学研究院学报 . 2019,第6期
6. 基于李雅普诺夫稳定跟踪的小天体软着陆障碍规避控制方法 [C] . 胡海静 ,朱圣英 ,崔平远 . 2014年中国宇航学会深空探测技术专业委员会第十一届学术年会 . 2014
7. 基于改进强化学习的机械臂无标定视觉伺服控制 [A] . 王腾飞 . 2019

基于改进Q学习的机械臂实时障碍规避方法

摘要

著录项

相似文献

相关主题

期刊订阅