...
机译:非线性分布式参数系统非零和游戏处理非零综合加固学习算法
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang Liaoning Peoples R China;
Tsinghua Univ Dept Elect Engn Beijing 100084 Peoples R China;
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang Liaoning Peoples R China;
Northeastern Univ State Key Lab Synthet Automat Proc Ind Shenyang Liaoning Peoples R China;
Integral reinforcement learning; off-policy algorithm; nonzero sum game; distributed parameter systems; adaptive dynamic programming;
机译:非线性分布式参数系统非零和游戏处理非零综合加固学习算法
机译:解决非线性连续时间多人非零和游戏的非策略整体强化学习方法
机译:利用禁止策略强化学习的离散时间系统的数据驱动非零游戏
机译:部分未知的非零和游戏的非策略强化学习
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:智能无线传感器网络的分布式学习和分布式估计算法
机译:错误到:用于多智能经纪非零 - 输入系统的多代理非极化游戏的强化学习和神经网络