首页> 外文期刊>電子情報通信学会技術研究報告. オフィスシステム >Multi-agent reinforcement learning method for Markov games: an approach based on the estimation of the environmental model
【24h】

Multi-agent reinforcement learning method for Markov games: an approach based on the estimation of the environmental model

机译:Markov Games的多功能增强学习方法:一种基于环境模型估计的方法

获取原文
获取原文并翻译 | 示例
           

摘要

In this article, we propose a multi-agent reinforcement learning method for Markov games. In our multi-agent reinforcement learning method, each agent infers the environmental model which consists of the other agents' policies and the state transition function, and estimates the future states by using the inferred environmental model. Each agent conducts its reinforcement learning based on the estimated future states. In order to evaluate our multi-agent reinforcement learning method, we employ the variant of the pursuit problem as a task. Through experiments, we demonstrate that our multi-agent reinforcement learning method is effective.
机译:在本文中,我们为马尔可夫游戏提出了一种多功能加强学习方法。 在我们的多功能增强学习方法中,每个代理商都是由其他代理商的政策和国家转型函数组成的环境模型,并通过使用推断的环境模型估计未来状态。 每个代理基于估计的未来州进行其强化学习。 为了评估我们的多功能增强学习方法,我们采用了追求问题的变体作为任务。 通过实验,我们证明了我们的多功能加强学习方法是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号