首页> 中国专利> 基于强化学习的机器人时间最优轨迹规划方法及控制器

基于强化学习的机器人时间最优轨迹规划方法及控制器

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了基于强化学习的机器人时间最优轨迹规划方法及控制器，所述方法包括以下步骤：S1将任务路径的各关节参数输入到路径参数化模块转化为关于末端路径的标量参数；S2将参数化后的路径输入到路径离散化模块进行路径离散化；S3将离散化后的路径输入到强化学习模块中构建强化学习环境；S4使用强化学习模块学习最优的策略轨迹；S5运行策略轨迹获得反馈的关节力矩；S6将反馈的关节力矩输入到强化学习模块从而对强化学习环境进行修正；S7使用强化学习模块学习最优的策略轨迹；S8重复步骤S5‑步骤S7，直到强化学习环境不再更新。

著录项

公开/公告号CN111983924B

专利类型发明专利
公开/公告日2022-03-15

原文格式PDF
申请/专利权人华南理工大学;中山市华南理工大学现代产业技术研究院;
展开▼

申请/专利号CN202010746579.1
发明设计人李琳;肖佳栋;张铁;邹焱飚;
展开▼

申请日2020-07-29
分类号G05B13/04(20060101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人江裕强
地址 510640 广东省广州市天河区五山路381号
入库时间 2022-08-23 13:15:53

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-15

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 基于强化学习的机器人时间最优轨迹规划方法及控制器 [P] . 中国专利： CN111983924A . 2020-11-24
2. 一种基于动力学的喷涂机器人时间最优轨迹规划方法 [P] . 中国专利： CN113084821A . 2021-07-09
3. 一种复杂工况下自动驾驶车辆决策系统及其轨迹规划方法 [P] . 世界知识产权组织专利： WO2020/143288A1 . 2020.07.16
4. 电机的控制方法及其控制器、测距传感器、移动平台 [P] . 世界知识产权组织专利： WO2020/142942A1 . 2020.07.16
5. 拖地机器人的控制方法、装置、设备及存储介质 [P] . 世界知识产权组织专利： WO2020/143291A1 . 2020.07.16