首页> 中文学位 >军棋机器人UCT算法及计算机博弈行为研究
【6h】

军棋机器人UCT算法及计算机博弈行为研究

代理获取

目录

声明

第1章 绪论

1. 1 课题研究背景

1.1.1 机器人学

1.1.2 计算机博弈

1. 2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1. 3 本课题研究意义

1. 4本文主要工作

1.4.1具体研究内容

1.4.2本文组织结构

第2章 计算机博弈关键技术分析

2.1 博弈基本原理

2.2 博弈相关研究方法

2.2.1 博弈搜索树

2.2.2 搜索复杂度分析

2.2.3 开局库与残局库分析

2. 3 经典博弈算法介绍

2.3.1 极大极小值算法

2.3.2 alpha-beta剪枝算法

2.3.3 蒙特卡罗算法

2.3.4 UCT算法

2.3.5 强化学习算法

2. 4 本章小结

第3章 军棋计算机博弈模型构建

3. 1 博弈分类及军棋博弈简介

3. 2 军棋非完备信息博弈分析

3.2.1 非完备信息棋局处理

3.2.2 启发式棋子隶属度估计

3. 3 动态估值策略实现

3.3.1 棋子四大要素介绍及初始化

3.3.2 棋子动态估值及实现

3. 4 动态估值参数优化及性能对比

3. 5 本章小结

第4章 基于UCT的协同搜索策略

4. 1 多棋子协同定义

4.2 Q学习算法应用

4.3 UCT算法进行高价值棋子的发现

4. 4 改进性能对比

4. 5 本章小结

第5章 意图博弈机器人行为规划

5. 1 博弈机器人行为规划模型

5. 2 对手意图的识别与行为预测

5.2.1 对手行为序列预估

5.2.2 引入意图对手行为序列

5.2.3 行为序列集

5. 3系统设计及效果展示

5.3.1意图博弈机器人系统设计

5.3.2 实验结果分析

5. 4本章小结

第6章 总结与展望

6. 1 本文的主要工作及创新点

6. 2 未来工作与展望

致谢

参考文献

个人简历、在学期间发表的学术论文及取得的研究成果

展开▼

摘要

机器人技术是当今世界备受关注的前沿课题,伴随着近年来人工智能技术不断的发展,机器人技术也成为了一个令人浮想联翩的技术领域。本文以大家喜闻乐见的中国传统的非完备信息二人军棋计算机博弈作为研究对象,军棋博弈的每方拥有25个棋子、12种类型棋子,每个棋子的级别、灵活性、价值都不相同,且双方都对彼此的策略一无所知,只能靠推理猜测决定走步,博弈过程中既要学会预防对方的欺骗又要学会蒙骗对手,加入机器人技术的情感识别能够帮助计算机博弈算法更好的识别对方策略,减少因对手欺骗而造成的损失,进而提升计算机博弈程序的战斗力。  论文创新工作体现在如下几点:  1)利用历史启发表来指导蒙特卡罗算法对敌方棋子隶属度进行模拟,极大的节省了模拟时间,并在我方棋子估值上针对军棋棋子种类多,估值缺乏适时性等问题上提出一种基于探索与收益均衡思想的Q-learning学习算法,完善了博弈过程中的动态估值系统,提高了估值的时效性。  2)提出基于UCT搜索策略的高价值棋子筛选方法,形成一种多棋子协同博弈方法,实现了多棋子协同对弈,提升了军棋计算机博弈系统中棋子的团体协同性、沟通性、欺骗性、引诱性等高级对抗能力。  3)结合博弈机器人意图情感建模理论技术和计算机博弈智能决策算法,提出军棋博弈机器人的行为体系二次构造过程,提升了军棋计算机博弈系统抗欺诈能力。  论文作者通过对军棋计算机博弈AI程序估值以及搜索算法上的修改并将程序命名为“KnighTeam-KS”跟随实验室计算机博弈团队参加了2018年安徽大学主办的中国大学生计算机博弈大赛暨第十二届中国计算机博弈锦标赛,并获得全国一等奖,验证了研究成果的可行性。并结合此系统与机器人技术对博弈行为进行二次规划,提高计算机博弈更好与人互动的趣味性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号