Convergence of UCT in Imperfect Information Games

机译：UCT在不完美信息游戏中的融合

代理获取

本网站仅为用户提供外文OA文献查询和代理获取服务，本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文，但由于OA文献来源多样且变更频繁，仍可能出现获取不到、文献不完整或与标题不符等情况，如果获取不到我们将提供退款服务。请知悉。

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

Táto práca sa zaoberá algoritmom the Upper confidence Tree, v skratke UCT, ktorý patrído velkej rodiny the Monte Carlo Tree Search algoritmov. Zamerali sme sa na zero-sum hrypre dvoch hrácov. Pozorovali sme vlastnosti UCT, aby sme zistili, preco konverguje tak rýchloa kedy UCT nekonverguje k Nashovmu equilibriu. Empiricky sme analyzovali konvergenciuUCT v jednoduchých maticových hráca v sekvencných hrách so simultánnymi tahmi rôznejkomplexnosti. Použili sme náhodne generované hry na hladanie problémov konvergencieUCT. Priamo sme porovnali dve modifikácie, menovite Sliding Window a nedeterministickúmodifikáciu. Obidve majú svoje plusy a mínusy. Navrhli sme zlepšenie nedeterministickejmodifikácie.

机译：这项工作涉及的缩写为UCT的Upper confidence Tree算法，该算法属于Monte Carlo Tree Search算法的大家族。我们专注于针对两个玩家的零和游戏。我们观察了UCT的性质，以找出为什么当UCT不收敛到纳什均衡时它收敛这么快的原因。根据经验，我们分析了具有不同复杂度的同时移动的连续游戏中简单矩阵玩家中PROD的收敛性。我们使用随机生成的游戏来解决融合问题。我们直接比较了两个修改，即滑动窗口修改和非确定性修改。两者都有其优点和缺点。我们提出了对不确定性修改的改进。

著录项

作者
Briedoň Marián;
展开▼
作者单位

展开▼
年度 2015
总页数
原文格式 PDF
正文语种
中图分类

相似文献

外文文献
中文文献
专利

1. Reduced Space and Faster Convergence in Imperfect-Information Games via Pruning [J] . Noam Brown, Tuomas Sandholm JMLR: Workshop and Conference Proceedings . 2017,第2010期

机译：通过修剪减少空间和不完美信息游戏的更快融合
2. Specialization of a UCT-Based General Game Playing Program to Single-Player Games [J] . Maciej Świechowski, Jacek Mańdziuk, Yew Soon Ong Computational Intelligence and AI in Games, IEEE Transactions on . 2016,第3期

机译：基于UCT的通用游戏程序专门用于单人游戏
3. Combining UCT and Nested Monte Carlo Search for Single-Player General Game Playing [J] . Mehat J., Cazenave T. Computational Intelligence and AI in Games, IEEE Transactions on . 2010,第4期

机译：结合UCT和嵌套蒙特卡洛搜索进行单人通用游戏
4. A study on strategy acquisition on imperfect information game by UCT search [C] . Yuki Takaoka, Takashi Kawakami, Ryosuke Ooe IEEE/SICE International Symposium on System Integration . 2017

机译：基于UCT搜索的不完全信息博弈策略获取研究
5. Imperfect Learning in Video Game Artificial Intelligence. [D] . Burdeyny, Alisa. 2014

机译：电子游戏人工智能中的学习不完善。
6. Linking Online Gaming and Addictive Behavior: Converging Evidence for a General Reward Deficiency in Frequent Online Gamers [O] . Tim Hahn, Karolien Hilde Notebaert, Thomas Dresler, 2014

机译：将在线游戏与上瘾行为联系起来：常见在线游戏中普遍奖励不足的证据
7. UCT Algorithm in Imperfect Information Multi-Player Military Chess Game [O] . Jiajia Zhang, Xuan Wang, Jing Lin, 2008

机译：在不完美信息多人军事国际象棋游戏中的UCT算法

Convergence of UCT in Imperfect Information Games

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅