...
机译:具有无共享价值功能的多主体强化学习
Department of Computer ScienceState Key Laboratory for Novel Software Technology, Nanjing University, Nanjing, China;
Algorithm design and analysis; Games; Joints; Learning (artificial intelligence); Markov processes; Nash equilibrium; Game theory; Nash equilibrium; multiagent reinforcement learning; negotiation;
机译:通过合并单独学习的价值功能进行多主体强化学习
机译:通过合并单独学习的价值功能进行多主体强化学习
机译:通过合并单独学习的价值功能进行多主体强化学习
机译:基于多奖励功能在多读性行为获取的加固学习
机译:用动力系统解释集体行为:多核化趋化性的空间梯度传感和多核强化学习中的学习动态
机译:多主体合作与竞争与深度强化学习
机译:适应性学习:合作多读系统的新分散加固学习方法