Markov chain; OFDMA; femtocells; reinforcement learning;
机译:动态环境中机器人导航的强化学习算法
机译:物流涉及云制造中的QoS感知服务组成,深增强学习
机译:互动QoS感知服务组成的加固学习
机译:一种动态环境中宏观毫微微干扰的QoS意识到的加强学习算法
机译:关于用于增强学习的无模型策略迭代算法的收敛:不连续平均动力学下的随机逼近。
机译:上行链路中的分层QoS的双动态调度:强化学习方法
机译:HF干扰环境中的联合通道选择和数据调度:干扰感应加强学习方法