机译:未知变量的组合网络优化:具有线性奖励和个人观察力的多臂土匪
Department of Electrical Engineering, University of Southern California, Los Angeles, CA, USA;
Combinatorial network optimization; multi-armed bandits (MABs); online learning;
机译:IEEE 802.15.4.基于TSCH的吞吐量优化调度:组合多武装强盗方法
机译:随机在线优化。 单点和多点非线性多武装匪徒。 凸和强凸案
机译:组合多武装匪徒的紧张下限
机译:具有一般奖励功能的组合式多武装匪
机译:在瞬息万变的世界中学习:具有未知动态的躁动多臂强盗
机译:使用多播放器多武装强盗的毫米波无线网络中的网关选择
机译:具有未知变量的组合网络优化:多臂 带有线性奖励的强盗