首页> 中文期刊> 《运筹学学报》 >报酬无界的平均准则马氏决策过程

报酬无界的平均准则马氏决策过程

         

摘要

本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优不等式中的和有定义时最优不等式也成立.%This paper studies average optimality in Markov decision processes with countablestate space, nonempty action sets and unbounded reward function. New conditions arediscussed under which there exists an (ε) optimal stationary policy, and that the averagecriterion optimality inequality holds when the summation in it is well defined.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号