首页> 中国专利> 基于深度强化学习方法的中国象棋博弈学习方法及系统

基于深度强化学习方法的中国象棋博弈学习方法及系统

摘要

本发明提供了一种基于深度强化学习方法的中国象棋博弈学习方法及系统,包括:步骤S1:将局面特征输入深度卷积神经网络,输出当前局面评估值和所有合法着法的概率;步骤S2:当前局面根据当前局面评估值和合法着法的概率,利用蒙特卡洛树搜索对当前局面进行决策,选择下一步的着法并执行走子,获取当前局面特征,重复触发步骤S1至步骤S2,直至棋局走到终局,得到对弈结果。本发明通过基于人类专家棋谱的监督学习和基于自我对弈的自学习的技术特征,实现快速提升模型棋力,并以迭代式方法逐步增强棋力以至模型棋力最终超过人类棋手的技术效果。

著录项

  • 公开/公告号CN113599798A

    专利类型发明专利

  • 公开/公告日2021-11-05

    原文格式PDF

  • 申请/专利号CN202110983668.2

  • 发明设计人 姚建国;涂冰洁;赵立东;鹿艳梅;

    申请日2021-08-25

  • 分类号A63F3/02(20060101);G06T1/20(20060101);G06N3/04(20060101);G06N3/08(20060101);G06N5/04(20060101);G06N7/00(20060101);

  • 代理机构31236 上海汉声知识产权代理有限公司;

  • 代理人胡晶

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2023-06-19 13:10:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-17

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号