退出
我的积分:
中文文献批量获取
外文文献批量获取
张建行; 刘全;
苏州大学计算机科学与技术学院 江苏 苏州215006;
苏州大学江苏省计算机信息处理技术重点实验室 江苏 苏州215006;
吉林大学符号计算与知识工程教育部重点实验室 长春 130012;
软件新技术与产业化协同创新中心 南京210000;
深度确定性策略梯度; 连续控制任务; 经验回放; 累积回报; 分类经验回放;
机译:在线更新机制的混合电动跟踪车辆的深度确定性政策梯度基于能量管理策略
机译:基于深度确定性策略梯度(DDPG)的能量收集无线通信
机译:基于联盟区块链的深度确定性策略梯度算法,实现家庭间最佳电力交易
机译:基于学习的内容缓存和用户群集:一种深度确定性策略梯度方法
机译:通过视频回放增强外科教育:以视频回放对指导外科医生与手术患者之间反馈的性质和经验的影响为例
机译:控制动态双足行走的深度确定性策略梯度的实现
机译:无人机自动空中作战机动策略生成基于国家对冲深度确定性政策梯度和反增强学习的观察误差
机译:基于aLas报警算法的梯度和偏移策略的简化飞机配对方法概念分析与仿真。
机译:连续网络通过延迟深度确定性政策梯度在5G蜂窝通信网络中切片
机译:连续网络在5G移动网络中切割延迟深度确定性政策梯度
机译:基于深度神经网络的Q学习修剪经验存储器的方法和装置
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。