首页> 中国专利> 一种基于深度强化学习的机械臂控制方法及系统

一种基于深度强化学习的机械臂控制方法及系统

摘要

本发明涉及一种基于深度强化学习的机械臂控制方法及系统,方法包括:建立机械臂的环境空间、机械臂的状态、机械臂的动作以及抓取物体的目标位置;机械臂在每个时刻t观察自身状态st,选择一个动作at与环境进行交互,得到环境的反馈rt,并转移到下一个状态st+1,此时获得时刻t下的经验,et=(st,at,rt,st+1),即样本;构建短期记忆回放池B1和被遗忘回忆池B2;将获取的M个样本以η的概率替换B1中的样本;将所有被替换的样本存入B2中;在B1和B2中抽取B个样本;采用抽取的B个样本对神经网络进行训练,基于训练好的神经网络中,得到动作输出。本发明中的上述方法通过引入深度强化学习算法帮助机械臂进行实时动作决策,以最大奖励地完成目标区域的物体抓取任务,可以实现机械臂灵活准确的行为选择。

著录项

  • 公开/公告号CN114012735A

    专利类型发明专利

  • 公开/公告日2022-02-08

    原文格式PDF

  • 申请/专利权人 山西大学;

    申请/专利号CN202111475392.3

  • 发明设计人 魏巍;王达;李琳;梁吉业;

    申请日2021-12-06

  • 分类号B25J9/16(20060101);

  • 代理机构11569 北京高沃律师事务所;

  • 代理人刘芳

  • 地址 030006 山西省太原市小店区坞城路92号

  • 入库时间 2023-06-19 14:08:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-05

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号