Crew pairing problem; Flight Disturbances; Multi-Agent Markov Decision Processes; Stochastic Programming;
机译:有限多智能体马尔可夫决策过程中的部分分散强化学习
机译:CHQ:用于部分可观察的马尔可夫决策过程的多智能体强化学习方案
机译:关于平均成本马尔可夫决策过程的最小对方法,可数离散行动空间和严格无限成本
机译:基于多智能体马尔可夫决策过程的鲁棒乘员配对
机译:不确定条件下鲁棒机器人团队学习的并行马尔可夫决策过程。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:基于新的马尔科夫决策过程的机组机组人员的行为预测系统