Decision making; Algorithms; Stochastic processes; Mathematical models; Theses; Parallel processing; Iterations; Markov processes; Game theory; Optimization; Uncertainty; Methodology; Policies;
机译:局部可观马尔可夫决策问题的基于延迟奖励的遗传算法
机译:Palo界限为部分可观察到的随机游戏中的加固学习
机译:使用部分可观察的随机博弈优化蜜罐策略以防止动态横向移动
机译:使用单面部分可观察的随机游戏来解决零和安全游戏的顺序攻击
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:局部可观察定时游戏的高效动态算法