机译:基于有限的地平线马尔可夫决策过程的快速热处理系统的加固学习控制
VIT Univ Sch Elect Engn Vellore Tamil Nadu India;
VIT Univ Sch Elect Engn Vellore Tamil Nadu India;
Reinforcement Learning; Rapid Thermal Processing; Nonlinear control; Markov Decision Process; Process control; Multivariable control;
机译:基于有限的地平线马尔可夫决策过程的快速热处理系统的加固学习控制
机译:使用马尔可夫决策过程和神经网络综合加固学习的联合制造和现场微电网系统控制
机译:有限多智能体马尔可夫决策过程中的部分分散强化学习
机译:基于强化学习的有限水平马尔可夫决策过程算法
机译:游戏和有限马尔可夫链(控制,过程,系统,理论)中的分散学习。
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:基于强化学习的有限水平马尔可夫决策过程算法