...
机译:具有延迟反馈的多臂匪的最佳臂识别
机译:随机分配与延迟奖励的上下文多武装匪徒的非参数分配
机译:数字战役管理中延迟奖励条件下多臂匪问题分配策略的数值分析
机译:具有设置成本和/或设置时间延迟的多臂匪问题的优先级指标启发式
机译:PAC识别随机多武装匪徒的许多良好臂
机译:关于顺序分析的文章:具有可用性约束以及顺序更改检测和识别的多臂匪。
机译:吸烟和强盗:用多武装强盗任务测量的探索性行为的吸烟者和非吸烟者差异的初步研究
机译:数字竞选管理中延迟奖励条件下的多武装强盗问题