基于深度强化学习的移动机器人轨迹跟踪和动态避障研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着移动机器人运用领域日益广泛，对具有自组织、自学习、自适应的智能移动机器人要求不断提高，如何使得移动机器人决策系统在无需人为干预下，实现移动机器人对未知复杂动态环境下具备环境感知、局部路径规划、轨迹跟踪和动态避障的功能，且能保证导航决策系统的稳定性、平滑性和泛化性，是移动机器人决策系统领域研究的关键课题。　　本文针对移动机器人在局部可观测的非线性动态环境下，依赖激光雷达或摄像头等传感器感知的局部环境信息存在不确定性，依据不确定的感知信息构建出的环境地图必然存在噪声和不确定性，根据不确定的地图进行局部路径规划和动态避障，必将产生具有传递性的不确定性。通过人工编码设计出的专家系统来应对任何可能出错的场景是不现实的。针对以上存在的问题，本文提出基于视觉感知和智能决策控制的深度强化学习算法，实现移动机器人局部路径规划和动态避障，本文主要的研究工作如下：　　1.针对目前移动机器人轨迹跟踪和动态避障的存在问题进行调研，对局部路径规划和动态避障的相关算法进行介绍，并重点研究移动机器人的局部路径规划和动态避障算法的局限性。　　2.针对移动机器人对环境感知信息存在局限性，以及机器人存储的环境地图与感知信息不匹配，以及时间差分方法对动态障碍物进行轨迹预测存在不确定，对此提出基于Q值的深度强化学习算法，研究了移动机器人如何实现局部路径规划最短、偏离全局轨迹最小和快速到达目的地的控制策略，使用深度卷积神经网络对移动机器人的状态和对应的动作进行回归预测，实现移动机器人态势感知和智能决策的端到端控制，同时采用引导策略加快强化学习智能体对最优动作的搜索。移动机器人的避障和路径规划动作的优劣通过构造奖惩函数来实现。　　3.针对目前移动机器人避障决策控制系统过于依赖人为设计各种精妙的策略以应对复杂环境，而设计策略一旦有所疏忽，必将会产生灾难性后果。此外，传统的避障规划算法，将移动机器人视为环境中的唯一智能体，而对于其它的运动物体均视为“障碍物”。然而，在实际环境移动机器人导航决策过程中，机器人与动态环境中的其他运动物体之间是互动博弈关系，且基于Q值的深度强化学习算法无法适应连续动作空间问题，同时该算法无法解释决策推理过程，当系统发生故障的时候很难进行针对性的解决。针对以上问题，提出基于确定性策略梯度的深度强化学习算法，该算法采用行动者评论家框架，融合基于策略和基于值函数的强化学习方法。该算法输入是状态，输出的是确定性动作。　　4.针对深度强化学习的移动机器人轨迹跟踪及动态避障运动方向智能决策控制进行实验、验证和对比分析，验证该算法的可行性，同时与人工势场法进行对比，体现本算法具有的研究与应用价值。

著录项

作者
吴运雄;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科计算机技术
授予学位硕士
导师姓名曾碧;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
移动机器人,深度强化学习,轨迹跟踪,动态避障;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的移动机器人轨迹跟踪和动态避障 [J] . 吴运雄 ,曾碧 . 广东工业大学学报 . 2019,第001期
2. 基于双目视觉信息融合的移动机器人避障研究基于双目视觉信息融合的移动机器人避障研究 [J] . 谷凤伟 ,金西虎 ,姜珊 . 电子世界 . 2015,第018期
3. 轮式移动机器人轨迹跟踪与避障研究 [J] . 张立阳 ,陈奕梅 . 自动化与仪表 . 2017,第011期
4. 基于概率线路图的仓库移动机器人避障路径跟踪研究 [J] . 罗国荣 . 武汉交通职业学院学报 . 2021,第001期
5. 基于概率线路图的仓库移动机器人避障路径跟踪研究 [J] . 罗国荣 . 武汉交通职业学院学报 . 2021,第001期
6. 移动机器人同时轨迹跟踪与避障方法研究 [C] . Zhang Qi-bin ,张启彬 ,Wang Peng . 第16届中国系统仿真技术及其应用学术会议 . 2015
7. 基于深度强化学习的移动机器人在多个动态障碍物环境下避障研究 [A] . 龙航宇 . 2020

基于深度强化学习的移动机器人轨迹跟踪和动态避障研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅