首页> 中国专利> 减少过估计的模型化强化学习机器人控制方法及系统

减少过估计的模型化强化学习机器人控制方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种减少过估计的模型化强化学习机器人控制方法及系统，其包括：初始化环境和各网络参数；利用与真实环境的交互数据训练环境模型；利用策略网络πφ与训练后的环境模型交互，将交互数据存放在数据存放器Dmodel中；根据环境模型，采用Actor‑Critic方法进行策略训练，其中Critic评估方法采用带有方差惩罚项的评估方式，估计值根据权重λ进行调节；重复执行，直至收敛。本发明能解决策略退化的问题，缓解值函数的过估计问题。本发明可以广泛在机器人控制领域中应用。

著录项

公开/公告号CN113419424A

专利类型发明专利
公开/公告日2021-09-21

原文格式PDF
申请/专利权人清华大学深圳国际研究生院;
展开▼

申请/专利号CN202110757340.9
发明设计人李秀;贾若楠;
展开▼

申请日2021-07-05
分类号G05B13/04(20060101);
代理机构11245 北京纪凯知识产权代理有限公司;
代理人孙楠
地址 518071 广东省深圳市南山区丽水路2279号
入库时间 2023-06-19 12:40:27

法律信息

法律状态公告日

法律状态信息

法律状态
2023-08-18

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 减少过估计的模型化强化学习机器人控制方法及系统 [P] . 中国专利： CN113419424A . 2021-09-21
2. 一种基于强化学习的多组机器人协作控制方法及控制系统 [P] . 中国专利： CN109116854B . 2021.03.12
3. OPERATIONAL PARAMETER SETTING METHOD FOR POWER STATES ESTIMATION OF BATTERY IN SINGLE WHEEL ROBOT AND POWER STATES ESTIMATION METHOD OF BATTERY IN SINGLE WHEEL ROBOT AND CONTROLLING METHOD OF SINGLE WHEEL ROBOT [P] . 韩国专利： KR101901922B1 . 2018-09-28

机译：单轮机器人电池功率状态估计的工作参数设定方法和单轮机器人电池功率状态估计方法及单轮机器人控制方法
4. OPERATIONAL PARAMETER SETTING METHOD FOR POWER STATES ESTIMATION OF BATTERY IN SINGLE WHEEL ROBOT AND POWER STATES ESTIMATION METHOD OF BATTERY IN SINGLE WHEEL ROBOT AND CONTROLLING METHOD OF SINGLE WHEEL ROBOT [P] . 韩国专利： KR20180044482A . 2018-05-03

机译：单轮机器人电池功率状态估计的工作参数设定方法和单轮机器人电池功率状态估计方法及单轮机器人控制方法
5. Meta-Reinforcement Learning Gradient Estimation with Variance Reduction [P] . 美国专利： US2020234113A1 . 2020-07-23

机译：减少方差的元强化学习梯度估计