Reinforcement Learning; Model Predictive Control; Deep Learning;
机译:用于离散和连续动作的已知最佳解决方案的强化学习控制任务
机译:基于跨越蒙特 - 卡洛深度确定性政策梯度的批量学习基于批处理流程的最优控制
机译:边缘无处不在的分布式深度增强学习:在离散动作空间中分析拜占庭工
机译:演示指导的深度强化学习,用于敏捷人机交互控制策略
机译:基于宏观动作的多智能经济型深度加强学习合作任务
机译:采用深度加固学习采用延长离散动作空间的行动专业专业专家集合交易系统
机译:用于控制人体机器人相互作用的控制政策的示范引导的深度增强学习