...
机译:Gittins Index用于简单的Markov Birtit流程,具有切换成本,没有折扣
Novosibirsk State Univ Novosibirsk Novosibirsk Obl Russia;
multicomponent systems; Gittins index; simple family of alternative Markov bandit processes; multiarmed bandit problem; Markov decision process; controlled Markov processes; long run average return; no discounting; switching penalties; optimal strategy;
机译:Gittins Index用于简单的Markov Birtit流程,具有切换成本,没有折扣
机译:折扣马尔可夫决策流程,具有模糊成本
机译:时变马尔可夫决策过程,其状态依赖于折扣因素和成本不受限制
机译:折扣成本的马尔可夫决策过程:消除行动的程序
机译:在简单加法和乘法之间切换:由于问题难度,切换成本不对称
机译:使用Gittins索引的基于贝叶斯自适应强盗的设计用于具有正态分布端点的多臂试验
机译:Markov决策过程中的迭代算法,具有依赖折扣因子和无限性成本