...
机译:改变环境下工艺行业运营指标的加固学习决策
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang 110819 Peoples R China;
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang 110819 Peoples R China;
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang 110819 Peoples R China;
Actor-critic (AC) algorithm; experience replay; multiactor networks ensemble (MAE); operational indices; process industry; reinforcement learning (RL);
机译:基于有限的地平线马尔可夫决策过程的快速热处理系统的加固学习控制
机译:SRAM FPGA的基于加强学习的Markov决策过程(MDP)实施
机译:采用基于强化学习的马尔可夫决策过程卸载移动边缘计算功率控制的任务
机译:通过结合基于遗憾的人行道变更决策模型,使用安全强化学习进行自动驾驶
机译:半马尔可夫决策过程的固定探索新强化学习算法
机译:扩展的基底神经节强化学习模型以了解5-羟色胺和多巴胺在基于风险的决策奖励预测和惩罚学习中的作用
机译:自动化车道改变决策在动态和不确定公路环境中使用深度加固学习