Markov game; Markov decision process; Sample average approximation; Sampling;
机译:两人零和马尔可夫博弈的自适应对抗多武器强盗方法
机译:两人零和马尔可夫博弈:后退地平线方法
机译:在零和两人未招示的半马尔可夫游戏,具有彩色结构
机译:对抗两人零和马尔可夫游戏的对抗多武装强盗方法
机译:多臂土匪在马尔可夫决策过程和调度问题中的应用。
机译:吸烟和强盗:用多武装强盗任务测量的探索性行为的吸烟者和非吸烟者差异的初步研究
机译:两人制零和马尔可夫博弈游戏