首页> 外文会议>International Conference on Ubiquitous Robots and Ambient Intelligence >Controlling bicycle using deep deterministic policy gradient algorithm
【24h】

Controlling bicycle using deep deterministic policy gradient algorithm

机译:使用深度确定性策略梯度算法控制自行车

获取原文
获取外文期刊封面目录资料

摘要

Controlling a bicycle without human interaction is still a challenge for researchers. Most of the studies on this topic focus on the physical area of bicycle or designing controllers based on automatic control knowledge such as feedback controller, LQR controller. This study focuses on applying a state-of-the-art deep reinforcement learning algorithm called Deep Deterministic Policy Gradient to control the bicycle. The bicycle can use the learned controller (agent) to keep balancing or reach a specified goal.
机译:在没有人为干预的情况下控制自行车仍然是研究人员的挑战。关于此主题的大多数研究都集中在自行车的物理区域或基于自动控制知识的控制器的设计上,例如反馈控制器,LQR控制器。这项研究的重点是应用称为“深度确定性策略梯度”的最新深度强化学习算法来控制自行车。自行车可以使用学习到的控制器(代理)保持平衡或达到指定目标。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号