机译:像人类一样的奖励,用于训练平面手臂运动的强化学习控制器
Fluid Physics and Transport Processes Branch, NASA Glenn Research Center, Cleveland, OH, USA;
Brunskill Laboratory, School of Computer Science, Carnegie Mellon University, Pittsburgh, PA, USA;
Department of Mechanical Engineering, Cleveland State University, Cleveland, OH, USA;
School of Engineering, University of Kansas, Lawrence, KS, USA;
Department of Biomedical Engineering, Case Western Reserve University, Cleveland, OH, USA;
Muscles; Biological system modeling; Learning (artificial intelligence); Training; Computational modeling; Biomechanics; Physiology;
机译:使用人类产生的奖励训练演员关键性强化学习控制员进行手臂运动
机译:使用强化学习调整静液压两输出传动系统控制器
机译:无需强化或奖励多关节运动的迭代学习:对伯恩斯坦关于敏捷性的自由度问题的回顾
机译:两连杆平面机器人动态模型奖励功能研究
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:平面臂运动比例衍生控制器的优化与评价
机译:人类奖励为平面臂运动训练加强学习控制器
机译:从人类奖励中学习强化学习:奖励积极性,时间贴现,情节性和表现。