...
机译:通过Q学习方法对部分可观察的非零游戏进行数据驱动的自适应动态编程
China Univ Geosci Sch Automat Wuhan 430074 Hubei Peoples R China|Hubei Key Lab Adv Control & Intelligent Automat C Wuhan 430074 Hubei Peoples R China;
China Univ Geosci Sch Automat Wuhan 430074 Hubei Peoples R China|Hubei Key Lab Adv Control & Intelligent Automat C Wuhan 430074 Hubei Peoples R China;
China Univ Geosci Sch Automat Wuhan 430074 Hubei Peoples R China|Hubei Key Lab Adv Control & Intelligent Automat C Wuhan 430074 Hubei Peoples R China;
China Univ Geosci Sch Automat Wuhan 430074 Hubei Peoples R China|Hubei Key Lab Adv Control & Intelligent Automat C Wuhan 430074 Hubei Peoples R China;
Adaptive dynamic programming; nonzero-sum games; partially observable; Q-learning;
机译:通过Q学习方法对部分可观察的非零和游戏进行数据驱动的自适应动态规划
机译:离散时间系统非零和游戏的基于非策略的自适应动态规划方法
机译:具有部分约束输入的连续时间完全合作博弈的数据驱动自适应动态规划
机译:两人非零和游戏的数据驱动自适应动态规划
机译:通过数据驱动的层次可部分观察的马尔可夫决策过程的生成,自动化家庭和工作场所环境中的居民交互。
机译:优化适应性癌症治疗:动态规划和进化博弈论
机译:单面部分可观察追踪 - 逃避的动态规划 游戏
机译:部分可观测随机游戏协同与对抗决策的新算法