机译:在线ADP算法进行全面比较连续时间最优控制
Chinese Acad Sci Inst Automat State Key Lab Management &
Control Complex Syst Beijing 100190 Peoples R China;
Chinese Acad Sci Inst Automat State Key Lab Management &
Control Complex Syst Beijing 100190 Peoples R China;
Adaptive dynamic programming; Policy iteration; Integral reinforcement learning; Experience replay; Off-policy;
机译:在线ADP算法进行全面比较连续时间最优控制
机译:基于新型策略迭代算法的连续时间马尔可夫跳跃线性系统的在线自适应最优控制
机译:在线actor-critic算法解决连续时间无限视界最优控制问题
机译:基于在线策略迭代的算法来解决连续时间无限期最优控制问题
机译:连续时间系统的在线自适应最优控制。
机译:基于遗传算法的活动监测在线变化点检测的最优参数探索
机译:动力学完全未知的连续时间非线性系统的在线自适应最优控制
机译:几种梯度算法在最优控制问题中的比较