机译:基于超量指标和优势奖励的多目标蒙特卡洛树搜索
LRI, CNRS UMR 8623 & INRIA-Saclay, Universite Paris-Sud, 91405 Orsay Cedex, France;
LRI, CNRS UMR 8623 & INRIA-Saclay, Universite Paris-Sud, 91405 Orsay Cedex, France;
Reinforcement learning; Monte-Carlo Tree Search; Multi-objective optimization; Sequential decision making;
机译:基于超量指标和优势奖励的多目标蒙特卡洛树搜索
机译:帕累托 - 多目标Monte-Carlo树搜索的最佳运输路线规划
机译:基于超量的多目标优化问题定向搜索方法
机译:Monte-Carlo树搜索模拟的质量奖励
机译:具有启发式知识的蒙特卡洛树搜索:一种解决Go语言中捕获和生死问题的新颖方法。
机译:向潜在类别分析添加更多指标是有益还是有害?蒙特卡洛研究的结果
机译:基于超量指标和优势奖励的多目标蒙特卡洛树搜索