多智能体同时到达多目标点的协同强化学习算法

李瑞群; 王若冰; 田涛; 郑重; 张越

首页> 中文期刊> 《计算机应用与软件》 >多智能体同时到达多目标点的协同强化学习算法

多智能体同时到达多目标点的协同强化学习算法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

针对动态未知环境下多智能体多目标协同问题,为实现在动态未知环境下多个智能体能够同时到达所有目标点,设计函数式奖励函数,对强化学习算法进行改进.智能体与环境交互,不断重复"探索-学习-决策"过程,在与环境的交互中积累经验并优化策略,在未预先分配目标点的情况下,智能体通过协同决策,能够避开环境中的静态障碍物和动态障碍物,同时到达所有目标点.仿真结果表明,该算法相比现有多智能体协同方法的学习速度平均提高约42.86％,同时智能体能够获得更多的奖励,可以做到自主决策自主分配目标,并且实现同时到达所有目标点的目标.

著录项

来源
《计算机应用与软件》 |2021年第9期|199-204|共6页
作者
李瑞群; 王若冰; 田涛; 郑重; 张越;
展开▼
作者单位

中国航天系统科学与工程研究院北京100048;

中国航天系统科学与工程研究院北京100048;

航天宏康智能科技(北京)有限公司北京100048;

航天宏康智能科技(北京)有限公司北京100048;

航天宏康智能科技(北京)有限公司北京100048;

航天宏康智能科技(北京)有限公司北京100048;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工神经网络与计算;计算技术、计算机技术;
关键词
多智能体; 多目标; 同时到达; 协同避障; 强化学习;

相似文献

中文文献
外文文献
专利

1. 面向车联网的多智能体强化学习边云协同卸载 [J] . 叶佩文 ,贾向东 ,杨小蓉 . 计算机工程 . 2021,第004期
2. 基于多智能体强化学习的多园区综合能源系统协同优化运行研究 [J] . 杨照 ,黄少伟 ,陈颖 . 电工电能新技术 . 2021,第008期
3. 基于多智能体强化学习的无人集群协同设计 [J] . 郑健 ,陈建 ,朱琨 . 指挥信息系统与技术 . 2020,第006期
4. 基于多智能体强化学习的无人集群协同设计 [J] . 郑健 ,陈建 ,朱琨 . 指挥信息系统与技术 . 2020,第006期
5. 基于值分布的多智能体分布式深度强化学习算法 [J] . 陈妙云 ,王雷 ,盛捷 . 计算机系统应用 . 2022,第1期
6. 深度多智能体强化学习 [C] . 郝建业 . 2018中国大数据技术大会(BDTC） . 2018
7. 基于强化学习的移动多智能体自组织协同目标搜索 [A] . 狄小娟 . 2020

多智能体同时到达多目标点的协同强化学习算法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅