基于博弈论及Q学习的多Agent协作追捕算法

郑延斌; 樊文鑫; 韩梦云; 陶雪丽

首页> 中文期刊>计算机应用 >基于博弈论及Q学习的多Agent协作追捕算法

基于博弈论及Q学习的多Agent协作追捕算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

多Agent协作追捕问题是多Agent协调与协作研究中的一个典型问题。针对具有学习能力的单逃跑者追捕问题,提出了一种基于博弈论及Q学习的多Agent协作追捕算法。首先,建立协作追捕团队,并构建协作追捕的博弈模型;其次,通过对逃跑者策略选择的学习,建立逃跑者有限的Step-T累积奖赏的运动轨迹,并把运动轨迹调整到追捕者的策略集中;最后,求解协作追捕博弈得到Nash均衡解,每个Agent执行均衡策略完成追捕任务。同时,针对在求解中可能存在多个均衡解的问题,加入了虚拟行动行为选择算法来选择最优的均衡策略。C#仿真实验表明,所提算法能够有效地解决障碍环境中单个具有学习能力的逃跑者的追捕问题,实验数据对比分析表明该算法在同等条件下的追捕效率要优于纯博弈或纯学习的追捕算法。

著录项

来源
《计算机应用》|2020年第6期|1613-1620|共8页
作者
郑延斌; 樊文鑫; 韩梦云; 陶雪丽;
展开▼
作者单位

河南师范大学计算机与信息工程学院河南新乡453007;

智慧商务与物联网技术河南省工程实验室河南新乡453007;

展开▼
原文格式 PDF
正文语种 chi
中图分类机器人技术;
关键词
多Agent; 协作追捕; 博弈论; Q学习; 强化学习;
入库时间 2022-08-18 21:56:54

相似文献

中文文献
外文文献
专利

1. 基于博弈论及惩罚机制的多Agent协作控制算法 [J] . 郑延斌 ,陶雪丽 ,段领玉 . 河南师范大学学报：自然科学版 . 2015,第6期
2. 基于量子理论及蚁群算法的多Agent Q学习 [J] . 孟祥萍 ,王圣镔 . 计算机工程与应用 . 2010,第021期
3. 基于蚁群算法和轮盘算法的多Agent Q学习 [J] . 孟祥萍 ,王圣镔 ,王欣欣 . 计算机工程与应用 . 2009,第016期
4. 基于Meta平衡的多Agent Q学习算法研究 [J] . 王万良 ,濮约庆 ,赵燕伟 . 计算机科学 . 2012,第B06期
5. 基于分布式协作Q学习的信道与功率分配算法 [J] . 徐琳 ,赵知劲 . 计算机工程 . 2019,第006期
6. 一种多Agent协作的Q学习算法及其试验研究 [C] . 鲍翊平 ,姚莉 ,王长缨 . 第二十一届中国数据库学术会议 . 2004
7. 基于协作机制的多Agent追捕研究 [A] . 苏迪 . 2017

基于博弈论及Q学习的多Agent协作追捕算法

摘要

著录项

相似文献

相关主题

期刊订阅