首页> 外文期刊>TOP >Optimal policies for constrained average-cost Markov decision processes
【24h】

Optimal policies for constrained average-cost Markov decision processes

机译:约束平均成本马尔可夫决策过程的最优策略

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

We give mild conditions for the existence of optimal solutions for a Markov decision problem with average cost, under m constraints of the same kind, in Borel actions and states spaces. Moreover, there is an optimal policy that is a convex combination of at most m+1 deterministic policies.
机译:我们给出了在Borel动作和状态空间中,在m个相同类型的约束下,具有平均成本的Markov决策问题的最优解的存在的温和条件。此外,存在一个最佳策略,它是最多m + 1个确定性策略的凸组合。

著录项

  • 来源
    《TOP》 |2011年第1期|107-120|共14页
  • 作者单位

    Departamento de Probabilidad y Estadística Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Universidad Nacional Autónoma de México Apartado postal 20-726 Admon. No. 20 delegación álvaro Obregón 01000 Mexico City D.F. Mexico;

    Posgrado en Ingeniería de Sistemas Facultad de Ingeniería Mecánica y Eléctrica Universidad Autónoma de Nuevo León Ciudad Universitaria 66450 San Nicolás de los Garza N.L. Mexico;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Markov decision processes; Constraints; Stable measures; 90C40;

    机译:马尔可夫决策过程;约束;稳定措施;90C40;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号