Shenzhen Graduate School, Peking University, Shenzhen 518055, China;
Shenzhen Graduate School, Peking University, Shenzhen 518055, China;
Reinforcement learning; Monte Carlo sampling; Imperfect information;
机译:基于深度加强学习的控制框架和蒙特卡罗在下游分离中抽样的设计
机译:基于跨越蒙特 - 卡洛深度确定性政策梯度的批量学习基于批处理流程的最优控制
机译:事件驱动的免税与钢筋学习和无线网络技术的蒙特卡罗技术
机译:蒙特卡洛采样在不完美信息问题中的加固学习
机译:一种新的使用数据增强的蒙特卡洛方法。
机译:朝着蒙特卡罗树搜索和加固学习有效发现绿色综合途径
机译:引导蒙特卡罗树搜索算法在放射治疗中光束方向选择的加强学习应用
机译:评估蒸汽发生器管在役检查的抽样计划。第2卷,多个抽样计划的综合分析和蒙特卡罗模拟结果