退出
我的积分:
中文文献批量获取
外文文献批量获取
机译:政策模糊控制器的政策梯度加固学习:Robocup足球小型联赛中的决策
Masaya SUGIMOTO; Harukazu IGARASHI; Seiji ISHIHARA; Kazumoto TANAKA;
机译:策略中带有模糊控制器的策略梯度强化学习算法
机译:基于策略梯度法的不确定系统鲁棒强化学习控制器训练
机译:RoboCup足球禁区的强化学习
机译:在自主机器人控制器上使用策略梯度强化学习
机译:强化学习中顺序决策的有效近似策略迭代方法。
机译:更正:在连续状态和动作空间中基于峰值的强化学习:当策略梯度方法失败时
机译:策略控制体系结构,策略独立,策略用户和业务策略控制器,在第一源网络上启动服务并在第二网络上启动该服务的用户终端上的方法,以及独立身份提供者上的方法,用户策略控制器,业务策略控制器,服务策略控制器和网络策略控制器
机译:加强学习系统和生成决策策略,包括故障安全的方法
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。