退出
我的积分:
中文文献批量获取
外文文献批量获取
邓绍斌; 朱军; 周晓锋; 李帅; 刘舒锐;
中国科学院网络化控制系统重点实验室;
中国科学院沈阳自动化研究所;
中国科学院机器人与智能制造创新研究院;
中国科学院大学;
工业过程控制; 深度强化学习; 深度确定性策略梯度; 局部策略交互探索; 青霉素发酵过程;
机译:在线更新机制的混合电动跟踪车辆的深度确定性政策梯度基于能量管理策略
机译:基于深度确定性策略梯度(DDPG)的能量收集无线通信
机译:基于内容的交互式图像搜索方法基于探索原理的索引和搜索策略
机译:基于学习的内容缓存和用户群集:一种深度确定性策略梯度方法
机译:研究基于梯度的方法和进化算法的多目标优化混合策略。
机译:基于事件的不同采样策略在简单工业过程控制中的应用
机译:无人机自动空中作战机动策略生成基于国家对冲深度确定性政策梯度和反增强学习的观察误差
机译:基于aLas报警算法的梯度和偏移策略的简化飞机配对方法概念分析与仿真。
机译:在交互式Web实时通信(WebRTC)会话上应用公司策略的方法,包括基于WebRTC会话描述对象确定公司策略并将策略应用于描述对象
机译:系统具有本地交互的分布式联合基于均衡的策略搜索和全局策略选择
机译:安全策略分配系统,基于安全策略操作的设备,安全策略分配方法,安全策略分配程序以及记录有该程序的介质
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。