首页> 中文期刊>机器人产业 >最新无模型深度强化学习研究:从零开始训练机器人'玩乐高'

最新无模型深度强化学习研究:从零开始训练机器人'玩乐高'

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

伯克利最新提出无模型深度强化学习方法——soft Q-learning(SQL)算法,该算法可以对模拟和现实世界的任务执行组合性,同时在该算法基础上提出了一种使用具有表达性的神经网络策略学习机器人操作技能的学习框架。

著录项

来源
《机器人产业》|2018年第3期|48-51|共4页
作者
Tuomas Haarnoja; Vitchyr Pong; Aurick Zhou; Murtaza Dalal; Pieter Abbeel; Sergey Levine;
展开▼
作者单位

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
入库时间 2023-07-26 00:35:26

相似文献

中文文献
外文文献
专利

1. 最新无模型深度强化学习研究：从零开始训练机器人“玩乐高” [J] . Tuomas Haarnoja ,Vitchyr Pong ,Aurick Zhou . 机器人产业 . 2018,第003期
2. 基于无模型自适应的外骨骼式上肢康复机器人主动交互训练控制方法 [J] . 王晓峰 ,李醒 ,王建辉 . 自动化学报 . 2016,第012期
3. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报（自然科学版） . 2021,第003期
4. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报：自然科学版 . 2021,第003期
5. 美军化学防护服防护因数测试用机器人最新研究进展——采用全自动多关节型机器人模型进行防护因数测试的可行性探讨 [J] . 杨小兵 ,袁晓华 ,房鹤 . 中国个体防护装备 . 2011,第001期
6. 高原运动员“高原—亚高原交替训练”(含亚住高训)多次往返训练模式的研究 [C] . 刘娜 ,刘芳 ,李玉香 . 第五届中国多巴高原训练与健康国际研讨会 . 2018
7. 基于无模型自抗扰控制的全方位移动机器人轨迹追踪研究 [A] . 王剑 . 2019

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号