Hidden Markov models; Manganese; History; Indexes; Transient analysis; Complexity theory; Markov processes;
机译:一类不安定多武装匪徒问题标准奖励函数的贪心策略的最优性
机译:不安多臂强盗问题近视策略的最优性:公理化方法
机译:将有损无线网络中的定期实时流量调度为躁动多臂强盗
机译:一类具有确定性策略的躁动多臂土匪
机译:在瞬息万变的世界中学习:具有未知动态的躁动多臂强盗
机译:一类可恢复初始化的强盗的可失性和最佳索引策略
机译:一类单调仿射不动武装匪徒近视策略的优化性
机译:在变化的世界中学习:非贝叶斯不安定的多武装强盗