DSI, University of Milan via Comelico 39, I-20315 Milano, Italy;
Lehrstuhl Informatik II Universitaet Dortmund D-44221 Dortmund, Germany;
机译:多臂强盗问题的有限时间分析
机译:吸烟与强盗:对吸烟者和非吸烟者探索性行为的差异的初步研究,该差异是通过多臂匪徒任务测得的。
机译:吸烟和强盗:用多道主义匪徒任务测量的探索性行为的吸烟者和非主持人差异的初步研究。
机译:安全高斯过程强盗优化的遗憾界限
机译:从随机多武装匪中的低遗憾算法到低遗憾算法
机译:躁动多臂强盗游戏中的社会学习代理人的纳什均衡
机译:半有界网络带状算法的有限时间后悔 支持模型