首页> 中国专利> 一种新的节点价值混合更新方法

一种新的节点价值混合更新方法

摘要

本申请公开了一种新的节点价值混合更新方法,流程包括:在UCT树搜索过程中,分为选择阶段、扩展阶段、模拟阶段和反馈阶段四个阶段;UCT树的选择阶段、扩展阶段、模拟阶段使用SARSA(λ)算法更新博弈路径上的节点价值;UCT树的反馈阶段使用Q‑Learning算法更新搜索路径的上所有节点的价值;步骤4:得到UCT树搜索结果。本申请提出一种用于UCT树的SARSA(λ)与Q‑Learning相结合的节点价值混合更新方法,充分利用SARSA(λ)与Q‑Learning的优势,解决了相关技术中较长的训练时间以及较多的迭代次数,消耗算力资源的问题。

著录项

  • 公开/公告号CN111652369A

    专利类型发明专利

  • 公开/公告日2020-09-11

    原文格式PDF

  • 申请/专利权人 中央民族大学;

    申请/专利号CN202010405416.7

  • 发明设计人 李霞丽;吴立成;吕征宇;

    申请日2020-05-13

  • 分类号G06N3/08(20060101);G06N5/02(20060101);A63F3/00(20060101);A63F3/02(20060101);

  • 代理机构11541 北京卓唐知识产权代理有限公司;

  • 代理人卜荣丽

  • 地址 100081 北京市海淀区中关村南大街27号

  • 入库时间 2023-06-19 08:14:27

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号