机译:限制连续时间马尔可夫决策过程对有限地平线
Sun Yat Sen Univ Sch Math &
Computat Sci Guangzhou 510275 Guangdong Peoples R China;
Sun Yat Sen Univ Sch Math &
Computat Sci Guangzhou 510275 Guangdong Peoples R China;
Univ Liverpool Dept Math Sci Liverpool L69 7ZL Merseyside England;
Continuous-time Markov decision process; Constrained-optimality; Finite horizon; Mixture of N+1 deterministic Markov policies; Occupation measure;
机译:限制连续时间马尔可夫决策过程对有限地平线
机译:有限地平线风险敏感的连续时间马尔可夫决策流程,具有无限的过渡和成本率
机译:有限地平线连续时间马尔可夫决策过程,具有均值和方差标准
机译:平均奖励约束连续时间有限马尔可夫决策过程的最优控制
机译:约束马尔可夫决策过程的结构结果
机译:动态模拟端点空调连续时间的马尔可夫链在有限状态空间应用程序分子进化
机译:有限地平线上的约束连续时间马尔可夫决策过程