...
首页> 外文期刊>Dynamic games and applications >Limit Optimal Trajectories in Zero-Sum Stochastic Games
【24h】

Limit Optimal Trajectories in Zero-Sum Stochastic Games

机译:限制零加速游戏中的最佳轨迹

获取原文
获取原文并翻译 | 示例

摘要

We consider zero-sum stochastic games. For every discount factor lambda, a time normalization allows to represent the discounted game as being played during the interval [0, 1]. We introduce the trajectories of cumulated expected payoff and of cumulated occupation measure on the state space up to time t is an element of[0,1], under epsilon-optimal strategies. A limit optimal trajectory is defined as an accumulation point as (lambda,epsilon) tend to 0. We study existence, uniqueness and characterization of these limit optimal trajectories for compact absorbing games.
机译:我们考虑零和随机游戏。 对于每个折扣因素Lambda,时间归一化允许将折扣游戏表示在间隔[0,1]期间正在播放。 我们介绍了累积预期支付的轨迹和累积的占用措施,在普遍存在策略下的[0,1]的一个元素。 限制最佳轨迹被定义为累积点,因为(Lambda,epsilon)趋于0.我们研究了这些限制最佳轨迹的存在,唯一性和表征的紧凑吸收游戏。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号