机译:数字战役管理中延迟奖励条件下多臂匪问题分配策略的数值分析
Univ Politecn Madrid Dept Inteligencia Artificial Campus Montegancedo S-N Boadilla Del Monte Madri 28660 Spain;
Multi-armed bandit problem; Delayed reward; Numerical study; Digital campaign management;
机译:随机分配与延迟奖励的上下文多武装匪徒的非参数分配
机译:具有延迟反馈的多臂匪的最佳臂识别
机译:具有设置成本和/或设置时间延迟的多臂匪问题的优先级指标启发式
机译:延迟奖励条件下的数字战役管理中的多武装强盗问题
机译:多武装匪徒问题中策略的行为模型。
机译:探索随机离散多武装匪徒信息的价值分析
机译:数字竞选管理中延迟奖励条件下的多武装强盗问题