Synchronization; Observers; Multi-agent systems; Heuristic algorithms; Learning (artificial intelligence); Mathematical model; Protocols;
机译:异构多代理系统自适应最优输出同步的禁止策略学习
机译:基于非策略强化学习的异构系统最优无模型输出同步
机译:非线性分布式参数系统非零和游戏处理非零综合加固学习算法
机译:线性多算机系统分布式输出同步的禁止策略加强学习
机译:在多主体和分布式环境中研究相互联系的动力系统和强化学习。
机译:N网格分类系统中使用多智能体深度强化学习的分类控制
机译:用于分布式强化学习的多功能脱机演员 - 批评算法
机译:无限地平线Dec-pOmDp中策略同步的分布式强化学习。