首页> 中国专利> 基于动态模型与事后经验回放的多目标机器人控制方法

基于动态模型与事后经验回放的多目标机器人控制方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于动态模型与事后经验回放的多目标机器人控制方法，本发明能够学习到完成整个目标空间的策略，在泛化性上比现有方法更有优势；本发明通过基于模型的值函数估计和事后经验回放提高了多目标强化学习中的数据利用效率；相比其他离线值函数估计方法没有离线偏差，虽然存在模型误差，但是本发明通过单步与多步值函数估计的加权求和权衡了模型误差和学习速度，具有更好的表现。

著录项

公开/公告号CN112518742A

专利类型发明专利
公开/公告日2021-03-19

原文格式PDF
申请/专利权人清华大学深圳国际研究生院;
展开▼

申请/专利号CN202011281615.8
发明设计人李秀;杨瑞;吕加飞;杨宇;
展开▼

申请日2020-11-16
分类号B25J9/16(20060101);B25J13/00(20060101);G06F30/27(20200101);G06N7/00(20060101);G06F113/28(20200101);
代理机构44223 深圳新创友知识产权代理有限公司;
代理人江耀纯
地址 518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼
入库时间 2023-06-19 10:21:15

法律信息

法律状态公告日

法律状态信息

法律状态
2022-01-25

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 基于动态模型与事后经验回放的多目标机器人控制方法 [P] . 中国专利： CN112518742B . 2022.01.25
2. 基于动态模型与事后经验回放的多目标机器人控制方法 [P] . 中国专利： CN112518742A . 2021-03-19
3. TIME-LINE BASED DIGITAL MEDIA POST VIEWING EXPERIENCE [P] . 美国专利： US2015046949A1 . 2015-02-12

机译：基于时间线的数字媒体事后查看经验
4. ROBOT CONTROL METHOD AND A ROBOT SYSTEM, CAPABLE OF PREDICTING SINGULARITY THAT A ROBOT EXPERIENCES WHILE PERFORMING A MOTION IN ADVANCE BEFORE PERFORMING THE MOTION [P] . 韩国专利： KR20130017520A . 2013-02-20

机译：能够预测执行动作之前先进行动作的机器人经验的奇异性的机器人控制方法和机器人系统
5. METHOD FOR DETERMINING TARGET LOCATION BASED ON SIGHT LINE INFORMATION USING PLURALITY OF ROBOTS AND METHOD FOR ARRANGING PLURALITY OF ROBOTS THEREFOR [P] . 韩国专利： KR101480836B1 . 2015-01-13

机译：基于机器人多视线信息的目标位置确定方法及机器人多目标布置方法