首页> 中国专利> 基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法

基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法

摘要

本发明公开了机器学习技术领域的基于蒙特卡洛树搜索和卷积神经网络斗地主策略研究方法,所述的方法包括如下步骤:随机开始游戏并在每个玩家出牌时,以玩家当前状态为根节点,玩家按照斗地主规则可能采用的动作作为根节点的直接子节点;再从博弈树的根节点开始,使用蒙特卡洛树搜索算法进行不断的模拟抽样学习;当使用蒙特卡洛树搜索算法获得的数据足够多时,以(状态及可能出牌,当前状态下可能出牌对应的收益)为数据样本,不断训练卷积神经网络CNN学习网络,直到该网络稳定为止;针对CNN网络在学习时可能存在的误差,进一步使用策略改善算法对CNN网络学习结果进行修正改善。

著录项

  • 公开/公告号CN111729300A

    专利类型发明专利

  • 公开/公告日2020-10-02

    原文格式PDF

  • 申请/专利权人 贵州大学;

    申请/专利号CN202010589925.X

  • 发明设计人 王以松;彭啟文;

    申请日2020-06-24

  • 分类号A63F13/46(20140101);A63F13/822(20140101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11246 北京众合诚成知识产权代理有限公司;

  • 代理人刘妮

  • 地址 550025 贵州省贵阳市花溪区花溪大道

  • 入库时间 2023-06-19 08:28:36

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号