...
机译:具有协变量的多武装强盗问题的非参数解决方案
Peking Univ Sch Math Sci LMAM Beijing 100871 Peoples R China;
Peking Univ Sch Math Sci LMAM Beijing 100871 Peoples R China;
Beijing Inst Technol Sch Math &
Stat Beijing 100081 Peoples R China;
Efficient policy; Multi-armed bandit problem; Nonparametric solution; Subsample comparisons;
机译:具有协变量的多武装强盗问题的非参数解决方案
机译:具有协变量的多武装土匪的K最近邻UCB算法
机译:Minimax禁止惩罚惩罚多武装强盗模型,具有高维协调因子
机译:协变者多武装匪徒的仿真研究
机译:在扩展数据上使用引导重播的多武装强盗算法的离线评估
机译:吸烟和强盗:用多武装强盗任务测量的探索性行为的吸烟者和非吸烟者差异的初步研究
机译:具有协变量的多武装匪徒:理论与应用
机译:在变化的世界中学习:非贝叶斯不安定的多武装强盗