第一章 绪论
1.1研究背景和意义
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1国外研究现状
1.2.2国内研究现状
1.3主要研究内容
1.4论文组织结构
第二章 相关基础知识
2.1机器博弈
2.1.1机器博弈分类
2.1.2机器博弈经典方法
2.2卷积神经网络
2.2.1卷积神经网络的发展历程
2.2.2卷积神经网络基本结构
2.2.3卷积神经网络的训练过程
2.3蒙特卡洛树搜索
2.3.1蒙特卡洛法
2.3.2蒙特卡洛树搜索
2.4本章小结
第三章 基于手牌拆分的蒙特卡洛树搜索
3.1 “斗地主”博弈
3.1.1牌型介绍
3.1.2博弈特征描述
3.2手牌拆分算法
3.3基于手牌拆分的蒙特卡洛树搜索模型
3.4实验比较及分析
3.4.1与规则算法比较
3.4.2与7k7k小游戏世界“斗地主”智能体比较
3.4.3合作问题分析
3.5本章小结
第四章 结合卷积神经网络的蒙特卡洛树搜索
4.1基于蒙特卡洛树搜索和卷积神经网络的框架
4.2 CNN策略学习模块
4.3策略改善模块
4.4实验结果及分析
4.4.1与经典的深度强化学习算法间接比较
4.4.2与随机算法比较
4.4.3与RHCP算法比较
4.4.4与CQL算法比较
4.4.5 CQL、RHCP以及MCM算法相互比较
4.5本章小结
第五章 总结与展望
5.1总结
5.2展望
致谢
参考文献
附录
图版
表版
声明
贵州大学;