Deep reinforcement learning collision avoidance using policy gradient optimisation and Q-learning

Shady A. Maged; Bishoy H. Mikhail

首页> 外文期刊>International journal of computational vision and robotics >Deep reinforcement learning collision avoidance using policy gradient optimisation and Q-learning

【24h】

Deep reinforcement learning collision avoidance using policy gradient optimisation and Q-learning

机译：使用政策梯度优化和Q-Learning避免深增强学习碰撞

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Usage of trust region policy optimisation (TRPO) and proximal policy optimisation (PPO) 'children of policy gradient optimisation method' and deep Q-learning network (DQN) in Lidar-based differential robots are proposed using Turtlebot and OpenAI's baselines optimisation methods. The simulation results proved that the three algorithms are ideal for obstacle avoidance and robot navigation with the utter advantage for TRPO and PPO in complex environments. The used policies can be used in a fully decentralised manner as the learned policy is not constrained by any robot parameters or communication protocols.

机译：利用Turtlebot和Openai基线优化方法提出了使用Turtebot基础差动机器人的信托区域政策优化（TRPO）和近端政策优化（PPO）“近Q学习网络（DQN）的儿童。仿真结果证明，三种算法对于复杂环境中的TRPO和PPO的彻底优势，这三种算法是障碍物避免和机器人导航。使用的策略可以以完全分散的方式使用，因为学习的策略不受任何机器人参数或通信协议的限制。

著录项

来源
《International journal of computational vision and robotics》 |2020年第3期|260-274|共15页
作者
Shady A. Maged; Bishoy H. Mikhail;
展开▼
作者单位

Mechatronics Engineering Department Faculty of Engineering Ain Shams University;

Mechatronics Engineering Department Faculty of Engineering Ain Shams University;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
robot operating system; ROS; robotics; reinforcement learning; deep learning; deep Q-learning; trust region optimisation; proximal policy optimisation; PPO; trust region policy optimisation; TRPO; deep Q-learning network; DQN; Q-learning; autonomous; differential robot; obstacle avoidance; navigation; tensorflow;

机译：机器人操作系统;机器人;加强学习;深入学习;深入学习;信任区域优化;近期政策优化;PPO;信托区域政策优化;TRPO;DQN;Q-Learning;Q-Learning;自主;差动机器人;避免障碍;导航;Tensorflow;

相似文献

外文文献
中文文献
专利

1. Automatic collision avoidance of multiple ships based on deep Q-learning [J] . Shen Haiqing, Hashimoto Hirotada, Matsuda Akihiko, Applied Ocean Research . 2019,第期

机译：基于深Q学习的多艘船舶自动碰撞
2. Collision Avoidance in Pedestrian-Rich Environments With Deep Reinforcement Learning [J] . Michael Everett, Yu Fan Chen, Jonathan P. How Quality Control, Transactions . 2021,第1期

机译：富裕环境中的避免避免，具有深入的加强学习
3. Deep reinforcement learning-based collision avoidance for an autonomous ship [J] . Chun Do-Hyun, Roh Myung-Il, Lee Hye-Won, Ocean Engineering . 2021,第Auga15期

机译：基于深度加强的自主船舶的碰撞避免
4. Deep Reinforcement Learning: From Q-Learning to Deep Q-Learning [C] . Fuxiao Tan1, Pengfei Yan, Xinping Guan International conference on neural information processing . 2017

机译：深度强化学习：从Q学习到深度Q学习
5. On Deep Reinforcement Learning for Games: Generalization of Deep Q-Learning with Multiple Policy Heads [D] . Boucher, Mathieu. 2020

机译：关于游戏的深度加固学习：多重政策头部深度Q学的泛化
6. Distributed Non-Communicating Multi-Robot Collision Avoidance via Map-Based Deep Reinforcement Learning [O] . Guangda Chen, Shunyi Yao, Jun Ma, 2020

机译：通过基于地图的深度增强学习分布式非传送多机器人碰撞避免
7. Collision Avoidance in Pedestrian-Rich Environments With Deep Reinforcement Learning [O] . Michael Everett, Yu Fan Chen, Jonathan P. How 2021

机译：富裕环境中的避免避免，具有深入的加强学习

Deep reinforcement learning collision avoidance using policy gradient optimisation and Q-learning

摘要

著录项

相似文献

相关主题

期刊订阅