基于强化学习的多机器人追捕问题研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

一种分段式强化学习方法来求解多机器人最优协作追捕策略。
　　第三，研究未知环境下多个追捕机器人形成追捕团队追捕多个逃跑者的最优协作追捕策略问题。首先通过有选择的循环搜索法对逃跑目标进行搜索，发现目标后，基于目标分解与分配的理论基础，通过整数规划模型求解各目标的追捕团队。接着根据任务规划的结果，让各协作团队同时分周期独立学习各自的最优行为决策，团队成员根据其他成员在此状态下将要采取的动作行为执行最佳的响应动作，多次重复对策后得到该协作团队的学习目的解。学习过程中由于不同协作团队之间的行为选择相互影响，对学习结果进行周期监督，通过变化学习率来保证学习的有效性。考虑上述方法对于追捕目标分解与分配是相对粗略的，整数规划问题实际求解过程本身也很复杂，创建追捕团队时没有考虑到追捕者之间完成捕获任务的能力互补等问题，提出一种未知环境下结合案例推理强化学习方法的多机器人协作追捕多个逃跑目标策略，创建追捕团队时充分考虑追捕者之间能力互补问题，追捕团队成员协作追捕过程中，追捕者的行为选择同时参照历史经验及实际追捕者与逃跑者所处的状态进行决策。试验结果表明，该算法能够明显提高复杂环境下多机器人协作追捕目标的效率。
　　第四，开发了多机器人协作追捕目标仿真平台，为深入研究多机器人追捕目标问题提供了一个标准的试验平台。该仿真系统采用模块化设计，便于对新的算法进行仿真研究，并通过各种试验对本文所提方法进行了验证。

著录项

作者
李珺;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机应用技术
授予学位博士
导师姓名潘启树,洪炳镕;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类工业机器人;
关键词
强化学习; 多机器人; 最优协作追捕策略; 模块化设计;

相似文献

中文文献
外文文献
专利

1. 基于量子少数者博弈的多机器人追捕 [J] . 王浩 ,张浩 ,方宝富 . 模式识别与人工智能 . 2014,第012期
2. 基于Fast Marching方法的多机器人追捕算法 [J] . 丁磊 ,王浩 ,方宝富 . 广西师范大学学报（自然科学版） . 2011,第003期
3. 基于运动图式的多机器人合作追捕 [J] . 周浦城 ,韩裕生 ,薛模根 . 计算机工程 . 2008,第007期
4. 基于强化学习的多机器人仓储调度方法研究 [J] . CHEN Mingzhi ,QIAN Tonghui ,ZHANG Shizhen . 现代电子技术 . 2019,第014期
5. 基于模糊小波网络的强化学习及其在多机器人决策策略中的应用 [J] . 段勇 ,李程 ,徐心和 . 高技术通讯 . 2013,第004期
6. 基于NEAT方法的多机器人追捕一逃跑问题 [C] . 赵金 ,彭刚 . 第九届中国智能机器人学术研讨会 . 2011
7. 基于行为的多机器人追捕问题研究 [A] . 杨立苹 . 2005

基于强化学习的多机器人追捕问题研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅