机译:Cascade属性网络:使用分层神经网络分解加强学习控制政策
机译:通过适应性RBF神经网络和加强网络对网络控制系统的认知控制,经过时变延迟和分组损失
机译:随机神经网络中的强化学习以进行级联决策
机译:基于神经网络观察者的非策略强化学习对连续时间系统的输出反馈二次跟踪控制
机译:递归神经网络学习和神经网络学习控制器。
机译:神经网络移动机器人的路径规划和层次加强学习
机译:神经网络移动机器人的路径规划和层次加强学习
机译:用于闭环决策的分层神经网络(HNN):设计层次神经网络的体系结构以模拟注意,学习和目标导向行为。