基于强化学习的 RoboCup Keepaway 高层抢球策略

李学俊; 陈士洋; 张以文; 李龙澍

首页> 中文期刊> 《计算机应用与软件》 >基于强化学习的 RoboCup Keepaway 高层抢球策略

基于强化学习的 RoboCup Keepaway 高层抢球策略

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

In Robocop Keepaway training task,traditional hand-coded ball-stealing strategies are very subjective and can't adapt well to training situation changes,this leads to the takers taking longer time to complete the tasks and having lower stealing success rate.To solve this problem,we apply the reinforcement learning to high-level action decision-making for stealing takers in Keepaway task.By analysing the characteristic of stealing task,we reasonably design the state space,action space and reward value of the reinforcement learning model of stealing takers,and state a corresponding reinforcement learning algorithm for stealing takers.Experimental results show that after the rein-forced learning the stealing takers can make more objective decisions according to game's situation,the effect of the decisions made are re-markably better than the hand-coded strategies.For typical 4v3 and 5v4 scale Keepaway tasks,with the learned strategy to making decision, the stealing takers shorten 7.1% of the time at least for completing ball -stealing task,and the stealing success rate increases no less than 15.0% as well.%在 RoboCup Keepaway 任务训练中，传统手工抢球策略的主观性强，对训练情形变化的适应性差，导致抢球球员任务完成时间长、抢断成功率低。针对这一问题，将强化学习应用于 Keepaway 中抢球球员的高层动作决策。通过对抢球任务特点的分析，合理设计了抢球球员强化学习模型的状态空间、动作空间及回报值，并给出了抢球球员的强化学习算法。实验结果表明经强化学习后，抢球球员能够根据比赛情形做出更客观的决策，决策效果显著优于手工策略。对于4v3和5v4规模的典型 Keepaway 任务，抢球球员采用学习后的策略决策时，抢球任务完成时间至少缩短了7．1％，抢断成功率至少提升了15．0％。

著录项

来源
《计算机应用与软件》 |2015年第10期|101-104|共4页
作者
李学俊; 陈士洋; 张以文; 李龙澍;
展开▼
作者单位

安徽大学计算机科学与技术学院安徽合肥 230601;

安徽大学计算机科学与技术学院安徽合肥 230601;

安徽大学计算机科学与技术学院安徽合肥 230601;

安徽大学计算机科学与技术学院安徽合肥 230601;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
机器人足球; Keepaway; 强化学习; 抢球策略;

相似文献

中文文献
外文文献
专利

1. Keepaway抢球任务中基于策略重用的迁移学习算法 [J] . 李学俊 ,陈士洋 ,张以文 . 计算机科学 . 2015,第004期
2. 基于联合强化学习的RoboCup-2D传球策略 [J] . 常晓军 . 计算机工程与应用 . 2011,第023期
3. 基于神经网络的批强化学习在Robocup中的应用 [J] . 李龙澍 ,葛瑞峰 ,王慧萍 . 计算机技术与发展 . 2009,第007期
4. 基于模糊神经网络局部强化学习在Robocup中的应用 [J] . 吴定会 ,李真 ,纪志成 . 系统仿真学报 . 2007,第16期
5. 基于Markov对策的强化学习及其在RoboCup中的应用 [J] . 李镇宇 ,陈小平 . 计算机工程与应用 . 2005,第027期
6. Keepaway抢球任务中基于策略重用的迁移学习算法 [C] . LI Xue-jun ,李学俊 ,CHEN Shi-yang . 2014湖北省计算机学会学术年会 . 2014
7. 基于强化学习的RoboCup 2D高层抢球策略研究 [A] . 陈士洋 . 2014

基于强化学习的 RoboCup Keepaway 高层抢球策略

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅