...
机译:多武装匪徒知识梯度策略中的弱点识别与缓解
Univ Lancaster, STOR I Ctr Doctoral Training, Lancaster LA1 4YF, England;
Univ Lancaster, Dept Math & Stat, Lancaster LA1 4YF, England;
Univ Lancaster, Dept Management Sci, Lancaster LA1 4YX, England;
stochastic dynamic programming;
机译:成本约束下的渐近最优多武装强盗政策
机译:具有能量收集功能的多路访问通信:一种多武装的强盗模型和近视策略的最优性
机译:随机多武装强盗问题的弱一致性策略的下界和选择性
机译:多目标多臂匪问题中的线性标量知识梯度
机译:关于顺序分析的文章:具有可用性约束以及顺序更改检测和识别的多臂匪。
机译:吸烟和强盗:用多武装强盗任务测量的探索性行为的吸烟者和非吸烟者差异的初步研究
机译:识别和缓解多臂匪徒知识梯度政策中的弱点