退出
我的积分:
中文文献批量获取
外文文献批量获取
范静宇; 刘全;
苏州大学计算机科学与技术学院;
苏州大学江苏省计算机信息处理技术重点实验室;
吉林大学符号计算与知识工程教育部重点实验室;
软件新技术与产业化协同创新中心;
Q学习; 深度学习; 异策略强化学习; 连续动作空间; 最大熵; 软行动者—评论家算法;
机译:基于加权协作强化学习的底层D2D通信节能自主资源选择策略
机译:基于偏好的强化学习:使用基于偏好的竞速算法进行进化直接策略搜索
机译:基于偏好的强化学习:形式框架和策略迭代算法
机译:基于最大熵模型的电感转移学习加权算法
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:在强化学习任务中外向性区分基于模型的策略和没有模型的策略
机译:基于强化学习的随机调度与规划
机译:基于元模仿学习和元强化学习的元学习机器人控制策略的有效自适应
机译:基于元模仿学习和元强化学习的元学习高效适应新任务的机器人控制策略
机译:基于强化学习的主动学习控制策略学习与车辆控制方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。