首页> 外国专利> SYSTEM AND METHOD FOR TREE-BASED MACHINE LEARNING

SYSTEM AND METHOD FOR TREE-BASED MACHINE LEARNING

机译:基于树的机器学习系统和方法

摘要

Systems and methods of updating a multi-level data structure for controlling an agent. The method may include: accessing a data structure defining one or more nodes. A non-leaf node of the one or more nodes may be associated with one or more edges for traversing to a subsequent node. An edge of the one or more edges may be associated with a visit count and a softmax state-action value estimation. The method may include identifying a node trajectory including a series of nodes based on an asymptotically converging sampling policy, where the node trajectory includes a root node and a leaf node of the data structure, determining a reward indication associated with the node trajectory; and for at least one non-leaf node, updating the visit count and the softmax state-action value estimate associated with one or more edges of the non-leaf node based on the determined reward indication.
机译:更新用于控制代理的多级数据结构的系统和方法。该方法可以包括:访问定义一个或多个节点的数据结构。一个或多个节点中的非叶节点可以与一个或多个边缘相关联,以遍历到后续节点。一个或多个边缘中的一个边缘可以与访问次数和softmax状态动作值估计相关联。该方法可以包括:基于渐近收敛采样策略来识别包括一系列节点的节点轨迹,其中该节点轨迹包括数据结构的根节点和叶节点,确定与该节点轨迹相关联的奖励指示;以及对于至少一个非叶子节点,基于所确定的奖励指示,更新与所述非叶子节点的一个或多个边缘相关联的访问次数和softmax状态作用值估计。

著录项

  • 公开/公告号US2020234167A1

    专利类型

  • 公开/公告日2020-07-23

    原文格式PDF

  • 申请/专利权人 ROYAL BANK OF CANADA;

    申请/专利号US202016751203

  • 发明设计人 CHENJUN XIAO;RUITONG HUANG;

    申请日2020-01-23

  • 分类号G06N7;G06F17/11;G06K9/62;G06F16/901;

  • 国家 US

  • 入库时间 2022-08-21 11:23:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号