机译:基于队列的随机博弈中多主体学习的actor-Critic算法
Indian Institute of Management Bangalore, Bangalore-560076, India;
D-103. Marsh Palm Retreat Outer Ring Road, Bangalore-560103, India;
Service markets; Queues; Dynamic pricing; Stochastic games; Learning in games; Reinforcement learning;
机译:用于分布式强化学习的多功能脱机演员 - 批评算法
机译:固定时间空间差异游戏申请普里雷普雷斯模糊演员 - 评论家算法
机译:用于某一般性加速游戏的多功能逆钢筋学习
机译:分布式多功能演员 - 批评算法,应用于随机路径发现问题
机译:一种有限于钢筋学习的批评算法
机译:多主体强化学习和近似模型学习的竞技游戏
机译:用于分布式强化学习的多功能脱机演员 - 批评算法