...
机译:风险敏感折扣连续时间马尔可夫决策流程,具有无限性率
Sun Yat Sen Univ Sch Math Guangzhou Peoples R China;
South China Normal Univ South China Res Ctr Appl Math &
Interdisciplinary Guangzhou Peoples R China;
continuous-time Markov decision process; unbounded transition and cost rates; risk-sensitive discounted optimality; the optimality equation; Foster-Lyapunov and logarithm growth conditions;
机译:风险敏感折扣连续时间马尔可夫决策流程,具有无限性率
机译:有限地平线风险敏感的连续时间马尔可夫决策流程,具有无限的过渡和成本率
机译:具有无限制利率和依赖历史的随机策略的折扣连续时间马尔科夫决策过程:动态规划方法
机译:成本敏感的马尔可夫决策过程的迭代风险度量
机译:马尔可夫决策过程计算减排策略调查
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:有限地平线风险敏感的连续时间马尔可夫决策流程,具有无限的过渡和成本率
机译:具有无限奖励的可数州折现马尔可夫决策过程