一种高效率的多智能体协作学习通信机制

赵宇航; 马修军

首页> 中文期刊>信息安全研究 >一种高效率的多智能体协作学习通信机制

一种高效率的多智能体协作学习通信机制

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目前人工智能的发展日新月异,从计算机视觉到自然语言处理,再到强化学习的研究,都有了不小的突破.但是绝大部分人工智能针对的目标都是单智能体的,这些研究者的目标是让单智能体的智能能够不断的提升.然而多智能体的突破更能解决复杂的问题,例如动物种群的繁衍、人类的团队协作等等.即使单个智能体的智能不是特别高,但如果智能体之间的交流、协作能够很有效率,从整体来看,这个智能体群落的智能会比较高.目前,多智能体协作学习领域通常使用强化学习框架,但大多研究没有显式地应用通信机制,以提高整体模型的效果.提出了一种基于通信过滤的Actor-Critic算法框架,它使多智能体环境中的智能体之间能够高效地交流,即使在没有Critic指导的执行阶段,高效率的通信也能够很好地帮助智能体协作.算法框架中采用了一个神经网络过滤智能体之间的信息,完成一个使低质量的冗余信息到高质量的低维信息的过程.设计了3个实验验证模型的效果,分别是2个协作学习场景和1个自动驾驶中的车道变换任务.实验结果表明,在引入沟通的多智能体协作学习中,该算法模型比其他类似的模型效果好.

著录项

来源
《信息安全研究》|2020年第4期|345-349|共5页
作者
赵宇航; 马修军;
展开▼
作者单位

北京大学信息科学技术学院北京100871;

机器感知与智能教育部重点实验室(北京大学) 北京100871;

展开▼
原文格式 PDF
正文语种 chi
中图分类设计与性能分析;
关键词
多智能系统; 强化学习; 协作学习; 人工智能; 自动驾驶;
入库时间 2023-07-25 23:52:28

相似文献

中文文献
外文文献
专利

1. 一种高效率的多智能体协作学习通信机制 [J] . 赵宇航 ,马修军 . 信息安全研究 . 2020,第004期
2. 基于多智能体的智能控制系统通信机制研究 [J] . 张淑琴 ,潘理虎 . 机械管理开发 . 2012,第004期
3. 移动智能体安全通信机制研究 [J] . 宋四新 . 计算机与数字工程 . 2008,第003期
4. 基于SEBI系统的多智能体通信机制研究 [J] . 王刚 ,骆祥峰 . 小型微型计算机系统 . 2004,第002期
5. 一种新的智能卡安全通信机制 [J] . 姚静晶 ,胡永涛 ,胡善学 . 电脑知识与技术 . 2010,第033期
6. 一种高效率CAD／CAM一体化系统模式建立的实例 [C] . 袁哲俊 . 第一届中国机电一体化学术会议 . 1988
7. 一种具有智能保护功能的高效率电源管理芯片的设计 [A] . 肖斌 . 2012

一种高效率的多智能体协作学习通信机制

摘要

著录项

相似文献

相关主题

期刊订阅