退出
我的积分:
中文文献批量获取
外文文献批量获取
吴信东; 魏少红;
不详;
强化策略; 归纳; 学习系统; 计算机;
机译:基于归纳学习的基于可靠性的签名识别系统
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
机译:基于非策略强化学习的离散时间不确定线性系统的数据驱动鲁棒控制
机译:具有两个追求者与一个逃避者的差分游戏的基于近似软策略迭代的强化学习
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:在强化学习任务中外向性区分基于模型的策略和没有模型的策略
机译:基于强化的基于学习的虚拟能量存储系统运行策略,用于风电预测不确定性管理
机译:基于实例的状态识别的强化学习的第一个结果
机译:验证方法,其中包括先恢复第一内容提供商的策略,再恢复第二策略的第二提供商的策略,验证至少在与第一个相关的规定上达成一致的策略提供补偿百分比,或者,传输第一个策略已连接给第二供应商的第二策略并传送给供应商的是连接到第一存储介质的;计算机系统;
机译:选择软件策略网络并基于所选策略网络自动控制相应软件客户端的强化学习技术
机译:通过基于CAD的深度逆强化学习自动生成机器人控制策略的方法和系统
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。