机译:在没有先验信息的情况下最佳地感测单个通道:平铺算法和后悔范围
LTCI, TELECOM ParisTech and CNRS, Paris, France;
Cognitive radio; opportunistic channel access; partially observable Markov decision processes (POMDPs); regret bounds; reinforcement learning; restless bandit;
机译:有预算的土匪:遗憾的下界和最佳算法
机译:保证最优性的单轨列车时间表:具有增强的下界的分支定界算法
机译:没有遗憾的情况下进行选路:选路游戏中使后悔最小化算法收敛到Nash均衡
机译:汤普森采样的先验后验和后验依赖后悔界限
机译:认知无线电系统的最佳频谱感知和信道搜索策略:算法,分析和实时实现。
机译:估计有或没有复发突变的重组下限的算法
机译:在没有先验信息的情况下最佳地感测单个通道:平铺算法和后悔边界