Multi agent learning; Contextual bandit; Incentivizing exploration;
机译:基于语调的基于Web的服务的方法 - 基于Birt方法的推荐系统
机译:通过稀疏交互与在线推荐的隐藏功能的上下文匪徒
机译:优化上下文匪徒的安全探索
机译:在辅助生活环境中的活动意识到活动意见的情境匪徒学习
机译:带有土匪反馈的自适应偏好学习:信息过滤,决斗土匪和激励探索
机译:制药公司付款是否会刺激日本医师的医疗事故?
机译:宣传探索和支付上下文匪徒的建议