RoboCup2D仿真足球队智能体协作研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人工智能隶属于复杂系统，起源于上个世纪50年代，近年来广泛地受到海内外学者的青睐。决策理论作为人工智能的重要研究分支，现已成为机器人行为选择和协调的核心问题。研究决策理论，对于人类掌控机器学习并让机器更好地服务人类起着重要的作用。本文以RoboCup2D仿真平台为基础，以增强仿真足球队的进攻和防守为方向，以对智能体决策建模、对智能体强化学习为方法，从四个章节展开对多智能体协作问题的深入探讨。
　　本文首先对前人的研究成果予以总结，并对关键的知识做出阐述，比如智能体的感知信息（视觉信息、听觉信息、自身感知信息），动作命令（单一命令、兼容命令）等等。然后根据球员的不同角色对球员的站位进行研究，做出了改善，并对改善后的结果进行实验，验证其有效性。
　　其次提出了基于树搜索算法的在线搜索动作序列机制，对树搜索算法进行求解，并提出了动作序列的概念。然后对强化学习和Q-Learning做了简单回顾，并根据这个提出了经验累积算法，定义了球员热区的概念，构造了学习型智能体。智能体在比赛的过程中，遇到正回报值的动作，就会在E矩阵中更新，下一次再遇到类似情况将会有很大概率选择该动作。
　　前两个研究主要是为了增强球队的进攻能力和整体作战能力，最后一项研究是针对防守，结合守门员动作的特殊性，基于POMDP模型对守门决策建模，并利用值迭代算法求解，结果以动作序列的形式实现。该动作序列实际上是一个动作集，动作集里的每一个动作都是使值迭代函数具有最大报酬值的动作。
　　本文提出的每一种算法和机制，笔者都在RoboCup2D仿真平台上进行了仿真，以对抗的形式，横向与世界强队比较，纵向与过去的球队比较，并对结果进行分析，验证本文提出的多智能体协作的策略和算法的可行性。

著录项

作者
周辉;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科仪器仪表工程
授予学位硕士
导师姓名高翔;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算机仿真;智能机器人;
关键词
RoboCup2D仿真平台; 人工智能; 协作策略; 工作原理; 机器人技术;

相似文献

中文文献
外文文献
专利

1. 基于RoboCup2D仿真的球队策略研究 [J] . 杨建 ,王萍 ,于雅鑫 . 计算机系统应用 . 2022,第1期
2. RoboCup2D仿真的若干评价指标的权重研究 [J] . 王婕 ,陈玮 . 计算机应用与软件 . 2012,第003期
3. 基于协作协进化的多智能体机器人协作研究 [J] . 汤琼 ,杨东勇 . 计算机工程与应用 . 2004,第028期
4. 带保障智能体的多智能体战斗模型仿真研究 [J] . 朱建冲 ,蔡纪伟 ,阮冰 . 海军工程大学学报 . 2009,第003期
5. 智能协作型防火墙仿真模型研究 [J] . 揣迎才 ,张明清 ,唐俊 . 信息工程大学学报 . 2013,第001期
6. 基于多智能体的无人作战防御系统协调协作机制研究 [C] . 叶媛媛 ,沈林成 . 第二届全国CSCW学术会议 . 2000
7. RoboCup2D比赛仿真机器人足球队的构建 [A] . 廖本先 . 2010

RoboCup2D仿真足球队智能体协作研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅