首页> 中国专利> 基于深度强化学习方法的中国象棋博弈学习方法及系统

基于深度强化学习方法的中国象棋博弈学习方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供了一种基于深度强化学习方法的中国象棋博弈学习方法及系统，包括：步骤S1：将局面特征输入深度卷积神经网络，输出当前局面评估值和所有合法着法的概率；步骤S2：当前局面根据当前局面评估值和合法着法的概率，利用蒙特卡洛树搜索对当前局面进行决策，选择下一步的着法并执行走子，获取当前局面特征，重复触发步骤S1至步骤S2，直至棋局走到终局，得到对弈结果。本发明通过基于人类专家棋谱的监督学习和基于自我对弈的自学习的技术特征，实现快速提升模型棋力，并以迭代式方法逐步增强棋力以至模型棋力最终超过人类棋手的技术效果。

著录项

公开/公告号CN113599798A

专利类型发明专利
公开/公告日2021-11-05

原文格式PDF
申请/专利权人上海交通大学;上海燧原科技有限公司;
展开▼

申请/专利号CN202110983668.2
发明设计人姚建国;涂冰洁;赵立东;鹿艳梅;
展开▼

申请日2021-08-25
分类号A63F3/02(20060101);G06T1/20(20060101);G06N3/04(20060101);G06N3/08(20060101);G06N5/04(20060101);G06N7/00(20060101);
代理机构31236 上海汉声知识产权代理有限公司;
代理人胡晶
地址 200240 上海市闵行区东川路800号
入库时间 2023-06-19 13:10:40

法律信息

法律状态公告日

法律状态信息

法律状态
2023-03-17

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习方法的中国象棋博弈学习方法及系统 [P] . 中国专利： CN113599798A . 2021-11-05
2. 一种基于模糊决策树的深度强化学习空战博弈解释方法和系统 [P] . 中国专利： CN111353606A . 2020-06-30
3. METHOD AND SYSTEM FOR LEARNING AUTOMATIC DRIVING AGENT BASED ON DEEP REINFORCEMENT LEARNING [P] . 韩国专利： KR20200108527A . 2020-09-21

机译：基于深度强化学习的自动驾驶代理学习方法及系统
4. METHOD AND SYSTEM FOR USING SKILL-BASED GAMING STRATEGIES WITH BOWLING [P] . 欧洲知识产权局专利： EP1663416A4 . 2007-10-03

机译：基于技能的基于博弈的博弈策略的方法和系统
5. METHOD AND SYSTEM FOR USING SKILL-BASED GAMING STRATEGIES WITH BOWLING [P] . 世界知识产权组织专利： WO2005016469A3 . 2006-04-13

机译：基于技能的基于博弈的博弈策略的方法和系统