Wireless communication; Training; Shape; Heuristic algorithms; Decision making; Reinforcement learning; Scheduling;
机译:基于上行的基于NOMA的长期吞吐量最大化方案,用于认知无线电网络:演员 - 评论家强化学习方法
机译:用于设备到设备通信的高效演员批评批评学习界面跨越蜂窝网络
机译:非马尔可夫域中的完全无模型的actor-critic递归神经网络强化学习
机译:使用连续参与者批评强化学习的基于自适应比例公平参数化的LTE调度
机译:数据驱动的在线网络优化通过强化学习
机译:车载社交网络中通过5G通信进行能源优化的强化学习
机译:空间 - 地面集成网络的公平感知链接优化:加强学习框架