首页> 外文OA文献 >No-regret Learning in Generalized Normal-Form Games with Sequential Strategies
【2h】

No-regret Learning in Generalized Normal-Form Games with Sequential Strategies

机译:具有顺序策略的广义范式游戏中的无悔学习

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Práce formalizuje zobecněné hry v normální formě se sekvenčními strategiemi a představuje koncepty pro hledání Nashova ekvilibria v těchto hrách. Tento herní model je identický s hrami v normální formě se sekvenčními strategiemi (NFGSS), ale nemá žádná omezení na výplatní funkci. Nejprve jsme použili Nashova ekvilibria z NFGSS jako odhad řešení zobecněného NFGSS. Dále jsme hledali řešení pomocí převedení NFGSS do normální formy a následně použili standardní metody. Jako poslední přístup jsme adaptovali Monte Carlo Counterfactual regret minimization (MCCFR) přímo na zobecněné NFGSS. Všechny tyto metody jsme testovali na třech doménách: Transit game (TG), Border protection game (BPG) a Ticket inspection game (TIG). MCCFR algoritmus konverguje k Nashovu ekvilibriu v BPG a v TIG. Pro TG nám dává lepší odhad řešení než zjednodušení zobecněného NFGSS na standardní NFGSS. Škálovatelnost tohoto algoritmu není vysoká, nicméně dokážeme s jeho pomocí vyřešit větší hry než za využití běžných metod na řešení NFG. Výsledky ukazují, že MCCFR algoritmus má nejlepší výsledky ze všech tří zkoumaných přístupů, a to nejen jako algoritmus na přesné řešení NFGSS pro TIG a BPG, ale i jako heuristika pro TG.
机译:这项工作通过顺序策略形式化了正规形式的广义博弈,并提出了在这些博弈中寻找纳什均衡的概念。该游戏模型与具有顺序策略(NFGSS)的常规形式的游戏相同,但是对支付功能没有限制。我们首先使用来自NFGSS的Nash平衡作为广义NFGSS解的估计。我们还通过将NFGSS转换为普通格式,然后使用标准方法来寻找解决方案。作为最后的选择,我们将蒙特卡洛反事实后悔最小化(MCCFR)直接应用于广义NFGSS。我们在三个域上测试了所有这些方法:过境游戏(TG),边境保护游戏(BPG)和票务检查游戏(TIG)。 MCCFR算法收敛于BPG和TIG中的Nash平衡。对于TG,与将广义NFGSS简化为标准NFGSS相比,它为我们提供了更好的解决方案估计。该算法的可扩展性不高,但是,与使用传统方法来解决NFG相比,我们可以使用它来解决更大的游戏。结果表明,MCCFR算法在所有三种研究方法中均取得了最佳结果,不仅作为针对TIG和BPG的NFGSS精确求解的算法,而且作为针对TG的启发式算法。

著录项

  • 作者

    Šilhavý Prokop;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种 ENG
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号