机译:使用强化学习的参考跟踪或状态调节的最佳调度
South Dakota Sch Mines & Technol, Dept Mech Engn, Rapid City, SD 57701 USA;
机译:使用加固Q-Learning调度,开关磁阻电动机驱动器的最佳跟踪电流控制
机译:使用强化学习的固定最终时间和固定模式序列的交换系统中的次优追踪
机译:基于神经网络的基于神经网络,通过加固学习的非播放连续时间非线性系统非零和游戏的最佳跟踪控制
机译:强化学习以实现最佳跟踪和监管:统一框架
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:循环间隔加固计划的时间跟踪
机译:使用加固Q-Learning调度,开关磁阻电动机驱动器的最佳跟踪电流控制