首页> 中文学位 >基于蒙特卡洛树搜索的“斗地主”研究
【6h】

基于蒙特卡洛树搜索的“斗地主”研究

代理获取

目录

第一章 绪论

1.1研究背景和意义

1.1.1研究背景

1.1.2研究意义

1.2国内外研究现状

1.2.1国外研究现状

1.2.2国内研究现状

1.3主要研究内容

1.4论文组织结构

第二章 相关基础知识

2.1机器博弈

2.1.1机器博弈分类

2.1.2机器博弈经典方法

2.2卷积神经网络

2.2.1卷积神经网络的发展历程

2.2.2卷积神经网络基本结构

2.2.3卷积神经网络的训练过程

2.3蒙特卡洛树搜索

2.3.1蒙特卡洛法

2.3.2蒙特卡洛树搜索

2.4本章小结

第三章 基于手牌拆分的蒙特卡洛树搜索

3.1 “斗地主”博弈

3.1.1牌型介绍

3.1.2博弈特征描述

3.2手牌拆分算法

3.3基于手牌拆分的蒙特卡洛树搜索模型

3.4实验比较及分析

3.4.1与规则算法比较

3.4.2与7k7k小游戏世界“斗地主”智能体比较

3.4.3合作问题分析

3.5本章小结

第四章 结合卷积神经网络的蒙特卡洛树搜索

4.1基于蒙特卡洛树搜索和卷积神经网络的框架

4.2 CNN策略学习模块

4.3策略改善模块

4.4实验结果及分析

4.4.1与经典的深度强化学习算法间接比较

4.4.2与随机算法比较

4.4.3与RHCP算法比较

4.4.4与CQL算法比较

4.4.5 CQL、RHCP以及MCM算法相互比较

4.5本章小结

第五章 总结与展望

5.1总结

5.2展望

致谢

参考文献

附录

图版

表版

声明

展开▼

著录项

  • 作者

    彭啟文;

  • 作者单位

    贵州大学;

  • 授予单位 贵州大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 王以松;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3F25;
  • 关键词

  • 入库时间 2022-08-17 11:22:02

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号