首页> 外国专利> DEEP REINFORCEMENT LEARNING-BASED ADAPTIVE GAME ALGORITHM

DEEP REINFORCEMENT LEARNING-BASED ADAPTIVE GAME ALGORITHM

机译:基于深度强化学习的自适应游戏算法

摘要

The present invention relates to the field of data processing, and discloses a deep reinforcement learning-based adaptive game algorithm, comprising the following steps: (A) acquiring policies for different degrees of cooperation; (B) generating policies for different degrees of cooperation; (C) detecting a cooperation policy of an opponent; and (D) making different coping policies. The technical effects of the present invention are as follows: trained detectors and policies for different degrees of cooperation are used to implement the existing concepts, such as Tit for tat, in sequential social dilemmas, improving the extensibility of the agent, and more intuitively acquiring competition policies superior to those already acquired.
机译:本发明涉及数据处理领域,公开了一种基于深度强化学习的自适应博弈算法,包括以下步骤:(A)获取不同合作程度的策略; (B)制定不同程度的合作政策; (C)检测对手的合作政策; (D)制定不同的应对策略。本发明的技术效果如下:用于训练的检测器和用于不同程度的合作的策略被用于实现现有概念,例如在连续的社会困境中实现“针锋相对”,提高代理的可扩展性,以及更直观地获得竞争政策优于已获得的政策。

著录项

  • 公开/公告号WO2020024097A1

    专利类型

  • 公开/公告日2020-02-06

    原文格式PDF

  • 申请/专利权人 DONGGUAN UNIVERSITY OF TECHNOLOGY;

    申请/专利号WO2018CN97747

  • 发明设计人 HOU HANXU;HAO JIANYE;WANG WEIXUN;

    申请日2018-07-30

  • 分类号G05B13/04;G06N3/02;

  • 国家 WO

  • 入库时间 2022-08-21 11:13:36

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号