首页> 中文学位 >幻影围棋非完美信息机器博弈问题关键算法研究
【6h】

幻影围棋非完美信息机器博弈问题关键算法研究

代理获取

目录

声明

摘要

第1章 引言

1.1 研究背景

1.2 机器博弈历史与发展

1.3 本文贡献

1.4 组织结构

第2章 机器博弈理论基础与相关算法介绍

2.1 机器博弈理论简介

2.1.1 博弈论相关概念简介

2.1.2 博弈论与机器博弈

2.2 机器博弈过程模型

2.2.1 拓展型博弈问题

2.2.2 完美信息拓展型博弈过程

2.2.3 非完美信息拓展型博弈过程

2.3 传统机器博弈基本算法

2.3.1 基于极大极小搜索算法

2.3.2 α-β剪枝搜索

2.3.3 负极大值算法

2.4 蒙特卡洛树搜索算法与UCT算法

2.4.1 蒙特卡洛树搜索方法

2.4.2 UCT算法

2.5 具有不完全信息的机器博弈算法

2.5.1 基于CFR的搜索算法

2.5.2 基于确定性融合的搜索算法

2.5.3 基于信息集的蒙特卡洛树搜索算法

2.6 本章总结

第3章 基于信念状态的非完美信息博弈问题建模

3.1 非完美信息拓展型博弈问题

3.1.1 非完美信息拓展型博弈问题介绍

3.1.2 非完美信息拓展型博弈问题的复杂度

3.2 基于信念状态的非完美信息拓展型博弈问题模型

3.2.1 信念状态

3.2.2 非完美信息拓展型博弈问题建模

3.3 非拓展型博弈问题到非完美信息拓展型博弈问题的转化

3.4 本章小结

第4章 信念状态-蒙特卡洛树搜索方法

4.1 信念状态树

4.2 传统的信念状态树搜索算法

4.3 基于蒙特卡洛方法的信念状态树搜索

4.4 信念状态-蒙特卡洛树搜索算法

4.4.1 信念状态-蒙特卡洛树搜索算法过程

4.4.2 探测和利用

4.5 本章小结

第5章 基于对手模型的信念学习算法

5.1 对手模型的相关工作

5.2 参与者的信念

5.3 基于部分偏执的信念学习

5.4 基于随机最优反应估计的信念学习

5.4.1 随机最优反应估计

5.4.2 基于随机最优反应估计的对手猜测算法

5.4.3 基于随机最优反应估计的对手预测算法

5.5 本章小结

第6章 搜索算法与信念学习方法在幻影围棋中的应用

6.1 幻影围棋博弈问题简介

6.2 幻影围棋博弈问题中信息的处理

6.2.1 幻影围棋博弈中的提子信息处理

6.2.2 幻影围棋博弈中的非法信息的处理

6.3 搜索算法与信念学习算法在幻影围棋中的应用

6.3.1 信念状态-蒙特卡洛树搜索算法在幻影围棋中的应用

6.3.2 信念学习算法在幻影围棋中的应用

6.4 幻影围棋博弈问题中搜索算法的改进方法

6.4.1 基于混合策略的信念状态-蒙特卡洛树搜索算法

6.4.2 基于AMAF启发的信念状态-蒙特卡洛树搜索算法

6.4.3 基于信息探测的信念状态-蒙特卡洛树搜索算法

6.5 本章小结

第7章 基于幻影围棋的算法效果比较

7.1 基于一层蒙特卡洛树搜索算法的幻影围棋程序

7.2 信念状态-蒙特卡洛树搜索算法与信念学习算法的效果

7.2.1 信念学习算法的效果

7.2.2 历史采样的数量对算法效果的影响

7.2.3 搜索时间对算法效果的影响

7.2.4 历史采样与模拟棋局数量的平衡

7.3 基于幻影围棋特点的改进方法的效果

7.3.1 混合策略方法的效果

7.3.2 AMAF启发算法的效果

7.3.3 信息探测算法的效果

7.4 本章小结

第8章 总结与展望

8.1 本文的主要贡献

8.2 进一步工作与展望

参考文献

致谢

攻读硕士学位期间的论文项目情况

展开▼

摘要

机器博弈是人工智能领域一个既古老又具有挑战的问题,为人工智能成果的验证提供了一个良好的平台。非完美信息博弈问题是机器博弈问题的一个重要的分支,由于这类博弈问题具有非完美信息,即参与者需要在只知道对手的部分信息的情况下做决策,因此,更接近现实世界中的决策问题,具有更高的研究价值。本文针对非完美信息博弈问题的关键算法进行了研究,尤其是具有大空间和高复杂度的非完美信息拓展型博弈问题,并在幻影围棋中对本文提出的算法的性能进行了分析,比较了不同算法的效果。
  本文以非完美信息拓展型博弈问题为基础和基本模型,给出了基于信念状态的非完美信息博弈问题的数学模型。在此模型的基础上,对非完美信息博弈问题的关键算法进行研究,提出了利用信念状态树的数据结构表示非完美信息博弈问题的博弈过程,以蒙特卡洛树搜索算法为基础,提出了信念状态-蒙特卡洛树搜索算法并应用于处理具有非完美信息的博弈决策问题。本文在信念状态-蒙特卡洛树搜索算法的基础上,提出了两种基于对手模型的信念学习算法,分别是基于部分偏执的信念学习算法和基于随机最优反应估计的信念学习算法,旨在利用非完美信息博弈问题的隐藏信息通过建立对手模型的使参与者获得更高的收益。之后,将信念状态-蒙特卡洛树搜索算法应用到幻影围棋博弈问题中,提出了幻影围棋博弈问题中信息的处理方法,并结合幻影围棋博弈问题的特点,给出了基于信念状态-蒙特卡洛树搜索算法在幻影围棋博弈问题中的改进算法进行了研究,提出了三种改进算法,包括混合策略、AMAF启发算法和信息探测。最后,在幻影围棋博弈问题下,对信念状态-蒙特卡洛树搜索算法的性能进行了分析,对两种信念学习算法的性能和效果进行了分析和对比,并且,对基于幻影围棋博弈问题的改建算法的效果进行了测试。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号