机译:无模型加固学习算法的实验评价,用于连续HVAC控制
Tech Univ Denmark Dept Technol Management & Econ DK-2800 Lyngby Denmark|Norwegian Univ Sci & Technol Dept Mfg & Civil Engn N-2815 Gjovik Norway;
Tech Univ Denmark Dept Technol Management & Econ DK-2800 Lyngby Denmark;
Tech Univ Denmark Dept Technol Management & Econ DK-2800 Lyngby Denmark;
Norwegian Univ Sci & Technol Dept Mfg & Civil Engn N-2815 Gjovik Norway;
Reinforcement learning; Continuous HVAC control; Actor-critic algorithms; Robustness; Energy efficiency; Soft Actor Critic;
机译:高斯工艺的多程度强化学习:基于模型和无模型算法
机译:高斯工艺的多程度强化学习:基于模型和无模型算法
机译:使用强化学习的中和过程的无模型学习控制
机译:通过无模型强化学习的连续空间MDP形式控制器综合
机译:基于无模型强化学习方法的PI控制器的动态调整。
机译:使用无模型的深度强化学习以多尺度控制神经系统
机译:通过无模型增强学习的连续空间MDP的正式控制器合成