不确定环境下的深度强化学习编队避障控制

禹鑫燚; 杜丹枫; 欧林林

首页> 中文期刊>高技术通讯 >不确定环境下的深度强化学习编队避障控制

不确定环境下的深度强化学习编队避障控制

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

多智能体编队避障控制的目的在于保持多智能体队形的同时完成避障。针对复杂环境的随机性和不确定性,提出了一种不确定环境下的深度强化学习编队避障控制方法。首先,设计了价值评估网络来增加多智能体编队过程中触碰障碍物或者到达期望位置这些特殊动作的经验,使智能体更快地理解环境规则。其次,在智能体选择动作时,基于贪心策略,对动作选择策略进行改进以提高智能体的学习效率。再次,设计了样本存储空间,在增加样本的利用率的同时提高模型训练效率,并且在决策阶段结合多步学习算法使价值估计更准确。最后,将提出的方法与其他算法进行了对比实验。仿真结果表明提出的方法能使多个智能体在维持队形的同时进行避障,并且有效地提高了智能体学习效率。

著录项

来源
《高技术通讯》|2022年第8期|836-844|共9页
作者
禹鑫燚; 杜丹枫; 欧林林;
展开▼
作者单位

浙江工业大学信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
深度强化学习; 避障; 编队控制; 多智能体; 神经网络;

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的工业机器人避障路径规划方法 [J] . 李文彪 . 制造业自动化 . 2022,第1期
2. 基于深度强化学习的智能消防小车自动避障预警系统 [J] . 凌涛 . 沈阳工程学院学报:自然科学版 . 2022,第1期
3. 基于深度强化学习的AGV避障方法 [J] . 徐广林 ,张勇 ,余联庆 . 信息与电脑 . 2022,第9期
4. 基于深度强化学习的舰载机动态避障方法 [J] . 薛均晓 ,孔祥燕 ,郭毅博 . 计算机辅助设计与图形学学报 . 2021,第007期
5. 基于深度强化学习的智能机器人避障决策模型 [J] . 凌涛 . 新乡学院学报（自然科学版） . 2021,第003期
6. 多移动机器人的分布式编队与避障控制 [C] . 陈杨杨 ,田玉平 . 第26届中国控制会议 . 2007
7. 基于深度强化学习的移动机器人在多个动态障碍物环境下避障研究 [A] . 龙航宇 . 2020

不确定环境下的深度强化学习编队避障控制

摘要

著录项

相似文献

相关主题

期刊订阅