Decision Making Systems; Manufacturing; Ramp-Up; Reinforcement Learning;
机译:基于MDP模型的强化学习平台用于生产站升级优化:Q学习分析
机译:使用Q批次更新规则对机器人足球进行批次强化学习
机译:使用强化学习技术,在等离子电流加速阶段降低中心螺线管通量消耗的安全系数曲线控制
机译:生产升级的强化学习:Q批处理学习方法
机译:改善学习和减少时间:基于约束的加强学习方法
机译:纠正:将个人学习风格与避免方法的动机特征和强化学习的计算方面联系起来
机译:基于MDP模型的强化学习方法,用于生产站的产能优化:Q学习分析