...
机译:CTMDP和连续时间Markov游戏中有限可达性的有限最优控制
Universitat des Saarlandes, Saarbriicken, Germany;
University of Liverpool, Liverpool, UK;
机译:CTMDP和连续时间马尔可夫游戏的最佳时间抽象调度程序
机译:统一连续时间马尔可夫决策过程中有界可及性概率的高效计算
机译:具有时间限制的连续时间随机游戏
机译:基于双随机梯度上升的连续时间马尔可夫决策过程中时间可及性的策略学习
机译:游戏和有限马尔可夫链(控制,过程,系统,理论)中的分散学习。
机译:动态模拟端点空调连续时间的马尔可夫链在有限状态空间应用程序分子进化
机译:CTMDPS和连续时间马罗瓦夫游戏中有限最佳控制
机译:零和马尔可夫博弈与排队系统的最坏情况最优控制