退出
我的积分:
中文文献批量获取
外文文献批量获取
邢立波;
华南理工大学;
机译:一种基于策略迭代的平均奖励强化学习算法:收益管理与收敛性分析的实证结果
机译:基于强化学习的认知模型的奖励时间,奖励和奖励
机译:基于分层强化学习的两轮机器人自平衡算法
机译:基于启发式奖励函数的分层强化学习算法
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:分层强化学习中基于动作子奖励的奖励优化方法
机译:稀疏分布内存中基于价值的强化学习算法,用于解决山地车问题
机译:将分层强化学习扩展到连续时间,平均奖励和多智能体模型
机译:使用基于奖励的学习玩具激励和强化学习的系统和方法
机译:基于多重交易平台的消费者忠诚度营销计划可在分层奖励系统下为会员提供高额奖励。
机译:基于用户所在地生活气候条件的深度强化学习算法的空调节能预冷/热训系统及方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。