首页> 中国专利> 一种基于深度强化学习的机械臂控制方法及系统

一种基于深度强化学习的机械臂控制方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种基于深度强化学习的机械臂控制方法及系统，方法包括：建立机械臂的环境空间、机械臂的状态、机械臂的动作以及抓取物体的目标位置；机械臂在每个时刻t观察自身状态st，选择一个动作at与环境进行交互，得到环境的反馈rt，并转移到下一个状态st+1，此时获得时刻t下的经验，et＝(st,at,rt,st+1)，即样本；构建短期记忆回放池B1和被遗忘回忆池B2；将获取的M个样本以η的概率替换B1中的样本；将所有被替换的样本存入B2中；在B1和B2中抽取B个样本；采用抽取的B个样本对神经网络进行训练，基于训练好的神经网络中，得到动作输出。本发明中的上述方法通过引入深度强化学习算法帮助机械臂进行实时动作决策，以最大奖励地完成目标区域的物体抓取任务，可以实现机械臂灵活准确的行为选择。

著录项

公开/公告号CN114012735A

专利类型发明专利
公开/公告日2022-02-08

原文格式PDF
申请/专利权人山西大学;
展开▼

申请/专利号CN202111475392.3
发明设计人魏巍;王达;李琳;梁吉业;
展开▼

申请日2021-12-06
分类号B25J9/16(20060101);
代理机构11569 北京高沃律师事务所;
代理人刘芳
地址 030006 山西省太原市小店区坞城路92号
入库时间 2023-06-19 14:08:07

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-05

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于深度强化学习的机械臂控制方法及系统 [P] . 中国专利： CN114012735A . 2022-02-08
2. 一种基于平面视觉深度强化学习的机械臂抓取控制方法 [P] . 中国专利： CN113524196A . 2021-10-22
3. DEEP REINFORCEMENT LEARNING SYSTEM-BASED MARKETING COST CONTROL METHOD [P] . 世界知识产权组织专利： WO2020029688A1 . 2020-02-13

机译：基于深度强化学习系统的营销成本控制方法
4. Method for Controlling a Catch mechanism based on single Power, because the catch mechanism based on single Power comprises a Drive Roller, a drive motor, a driven Roller and a tape, wherein the method comprises: 1) detect the moment of inertia of the Rodi I1 Llo Drive, the radius R of the Drive Roller.The R of the driven Roller and the moment of inertia (2, 2) control a Braking torque M1 of the drive motor; System. [P] . CL2014001268A1 . 2014-09-22

机译：一种基于单动力的抓取机构的控制方法，因为基于单动力的抓取机构包括驱动辊，驱动电机，从动辊和带，其中，该方法包括：1）检测罗迪惯性矩I1 Llo驱动器，驱动辊的半径R。从动辊的R和惯性矩（2，2）控制驱动电机的制动转矩M1;系统。
5. A virtual fashion fitting method based on consumer fashion preference systemt and control method in order for the system to do [P] . 韩国专利： KR20180059091A . 2018-06-04

机译：一种基于消费者时尚偏好系统的虚拟时尚试穿方法和控制系统的控制方法