声明
摘要
第1章 引言
1.1 研究背景
1.2 机器博弈历史与发展
1.3 本文贡献
1.4 组织结构
第2章 机器博弈理论基础与相关算法介绍
2.1 机器博弈理论简介
2.1.1 博弈论相关概念简介
2.1.2 博弈论与机器博弈
2.2 机器博弈过程模型
2.2.1 拓展型博弈问题
2.2.2 完美信息拓展型博弈过程
2.2.3 非完美信息拓展型博弈过程
2.3 传统机器博弈基本算法
2.3.1 基于极大极小搜索算法
2.3.2 α-β剪枝搜索
2.3.3 负极大值算法
2.4 蒙特卡洛树搜索算法与UCT算法
2.4.1 蒙特卡洛树搜索方法
2.4.2 UCT算法
2.5 具有不完全信息的机器博弈算法
2.5.1 基于CFR的搜索算法
2.5.2 基于确定性融合的搜索算法
2.5.3 基于信息集的蒙特卡洛树搜索算法
2.6 本章总结
第3章 基于信念状态的非完美信息博弈问题建模
3.1 非完美信息拓展型博弈问题
3.1.1 非完美信息拓展型博弈问题介绍
3.1.2 非完美信息拓展型博弈问题的复杂度
3.2 基于信念状态的非完美信息拓展型博弈问题模型
3.2.1 信念状态
3.2.2 非完美信息拓展型博弈问题建模
3.3 非拓展型博弈问题到非完美信息拓展型博弈问题的转化
3.4 本章小结
第4章 信念状态-蒙特卡洛树搜索方法
4.1 信念状态树
4.2 传统的信念状态树搜索算法
4.3 基于蒙特卡洛方法的信念状态树搜索
4.4 信念状态-蒙特卡洛树搜索算法
4.4.1 信念状态-蒙特卡洛树搜索算法过程
4.4.2 探测和利用
4.5 本章小结
第5章 基于对手模型的信念学习算法
5.1 对手模型的相关工作
5.2 参与者的信念
5.3 基于部分偏执的信念学习
5.4 基于随机最优反应估计的信念学习
5.4.1 随机最优反应估计
5.4.2 基于随机最优反应估计的对手猜测算法
5.4.3 基于随机最优反应估计的对手预测算法
5.5 本章小结
第6章 搜索算法与信念学习方法在幻影围棋中的应用
6.1 幻影围棋博弈问题简介
6.2 幻影围棋博弈问题中信息的处理
6.2.1 幻影围棋博弈中的提子信息处理
6.2.2 幻影围棋博弈中的非法信息的处理
6.3 搜索算法与信念学习算法在幻影围棋中的应用
6.3.1 信念状态-蒙特卡洛树搜索算法在幻影围棋中的应用
6.3.2 信念学习算法在幻影围棋中的应用
6.4 幻影围棋博弈问题中搜索算法的改进方法
6.4.1 基于混合策略的信念状态-蒙特卡洛树搜索算法
6.4.2 基于AMAF启发的信念状态-蒙特卡洛树搜索算法
6.4.3 基于信息探测的信念状态-蒙特卡洛树搜索算法
6.5 本章小结
第7章 基于幻影围棋的算法效果比较
7.1 基于一层蒙特卡洛树搜索算法的幻影围棋程序
7.2 信念状态-蒙特卡洛树搜索算法与信念学习算法的效果
7.2.1 信念学习算法的效果
7.2.2 历史采样的数量对算法效果的影响
7.2.3 搜索时间对算法效果的影响
7.2.4 历史采样与模拟棋局数量的平衡
7.3 基于幻影围棋特点的改进方法的效果
7.3.1 混合策略方法的效果
7.3.2 AMAF启发算法的效果
7.3.3 信息探测算法的效果
7.4 本章小结
第8章 总结与展望
8.1 本文的主要贡献
8.2 进一步工作与展望
参考文献
致谢
攻读硕士学位期间的论文项目情况