...
机译:利用加固学习优化锁定控制的锁定政策
TCS Research and IIT Bombay Mumbai India;
Microsoft Research Bangalore India;
Independent Systems Bangalore India;
Lockdowns; Epidemic Control; Reinforcement Learning;
机译:优化强化学习策略功能的搜索方法
机译:深度加强学习,优化建筑物室内温度控制和加热能耗
机译:结合增强学习和残差补偿方法的未知离散时间线性系统的容错优化跟踪控制
机译:基因监管网络中的平均第一段时间控制政策与强化学习控制政策
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:联合强化学习用于在多个IoT设备上训练控制策略
机译:一种生物启发加强学习规则,以优化机器人控制动态神经网络