首页> 外文期刊>Neurocomputing >An actor-Critic algorithm for multi-agent learning in queue-based stochastic games
【24h】

An actor-Critic algorithm for multi-agent learning in queue-based stochastic games

机译:基于队列的随机博弈中多主体学习的actor-Critic算法

获取原文
获取原文并翻译 | 示例

摘要

We consider state-dependent pricing in a two-player service market stochastic game where state of the game and its transition dynamics are modeled using a semi-Markovian queue. We propose a multi-time scale actor-critic based reinforcement algorithm for multi-agent learning under self-play and provide experimental results on Nash convergence.
机译:我们在两人服务市场随机游戏中考虑基于状态的定价,其中使用半马尔可夫排队对游戏状态及其过渡动态进行建模。我们提出了一种基于时间尺度行为者批评的自增强下的多智能体学习强化算法,并提供了关于纳什收敛的实验结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号