机译:基于模型预测控制的多步贪婪钢筋学习
Reinforcement learningModel predictive controlNonlinear systemBatch reactor;
机译:多步骤强化学习,用于电动非公路车辆的无模型预测能源管理
机译:自动船舶驱动系统采用采样高效的模型预测控制的加固学习方法
机译:基于加固学习的电力分配插入式混合动力电动汽车能源管理随机模型预测控制
机译:基于模型的强化学习与贪婪政策的紧张遗憾界限
机译:基于平均场模型的深增强学习策略,机器人群控制
机译:认知控制预测使用基于模型的强化学习
机译:用于电气脱气车辆的无模型预测能量管理的多步强化学习