机译:非线性两人零和游戏的同步策略迭代在线求解
approximate dynamic programming; Hamilton-Jacobi-Isaacs equation; Nash equilibrium; synchronous zero-sum game policy iteration;
机译:非线性两人零和游戏的同步策略迭代在线求解
机译:基于自适应动态规划的离散非线性系统两人零和游戏的稳定值迭代
机译:在线并发强化学习算法,用于求解部分未知的非线性连续时间系统的两人零和游戏
机译:非线性两人零和游戏的同步策略迭代在线求解
机译:两人零和随机游戏中的欺骗:理论和在战争游戏中的应用。
机译:改进的asano-ohya-khrennikov量子般的模型双人游戏中的决策过程具有非线性自我和交叉交互大脑杏仁杆菌和前额外-Coltex的条款
机译:在线游戏:使用同步策略迭代的非线性双人零和游戏的实时解决方案