机译:MEC-连续确定性系统的近乎最佳在线强化学习算法
State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China;
Algorithm design and analysis; Approximation algorithms; Heuristic algorithms; Learning systems; Partitioning algorithms; Polynomials; Upper bound; Efficient exploration; probably approximately correct (PAC); reinforcement learning (RL); state aggregation; state aggregation.;
机译:在线并发强化学习算法,用于求解部分未知的非线性连续时间系统的两人零和游戏
机译:用于多用户和多任务MEC系统的联合计算卸载和任务缓存:基于强化学习的算法
机译:通过价值迭代为一类部分未知的连续时间非线性系统进行在线加固
机译:连续状态系统的高效在线强化学习算法
机译:多主体系统:集成强化学习,投标和遗传算法。
机译:通过M椭球体进行体积计算的近最佳确定性算法
机译:更快的近乎最佳的强化学习:为E³算法增加适应性