...
首页> 外文期刊>Mathematical methods of operations research >A note on the structure of value spaces in vector-valued Markov decision processes
【24h】

A note on the structure of value spaces in vector-valued Markov decision processes

机译:关于向量值马尔可夫决策过程中值空间结构的注释

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

For a vector-valued Markov Decision process with discounted reward criterion, we study the structure of its value spaces defined for all initial states. At first we discuss the relationship between the value spaces, i.e. we verify a linking property for optimality. We next show that if the values of deterministic stationary policies generate a face of the value space, any point of that face can be represented as the value of a randomization of these policies. We also examine whether the value of a randomization of deterministic stationary policies lies on the face generated by the values of these policies.
机译:对于具有折现奖励标准的向量值马尔可夫决策过程,我们研究了为所有初始状态定义的其值空间的结构。首先,我们讨论值空间之间的关系,即验证链接属性的最优性。接下来,我们表明,如果确定性平稳策略的值生成了值空间的面,则该面的任何点都可以表示为这些策略的随机值。我们还研究了确定性平稳策略的随机化值是否位于这些策略的值所产生的面孔上。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号