【24h】

Multi-agent Learning Dynamics: A Survey

机译:多主体学习动力学:一项调查

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

In this paper we compare state-of-the-art multi-agent reinforcement learning algorithms in a wide variety of games. We consider two types of algorithms: value iteration and policy iteration. Four characteristics are studied: initial conditions, parameter settings, convergence speed, and local versus global convergence. Global convergence is still difficult to achieve in practice, despite existing theoretical guarantees. Multiple visualizations are included to provide a comprehensive insight into the learning dynamics.
机译:在本文中,我们比较了各种游戏中最先进的多主体强化学习算法。我们考虑两种算法:值迭代和策略迭代。研究了四个特性:初始条件,参数设置,收敛速度以及局部与全局收敛。尽管已有理论上的保证,但在实践中仍难以实现全球融合。包括多个可视化视图,以提供对学习动态的全面了解。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号