首页> 中国专利> 利用辅助任务的强化学习

利用辅助任务的强化学习

页面导航

摘要
著录项
法律信息
相似文献

摘要

包括在计算机存储介质上编码的计算机程序的用于训练强化学习系统的方法、系统和装置。该方法包括：训练动作选择策略神经网络，并且在动作选择神经网络的训练期间，训练一个或多个辅助控制神经网络和奖励预测神经网络。辅助控制神经网络中的每个辅助控制神经网络被配置为接收由动作选择策略神经网络生成的相应的中间输出，并生成对于对应的辅助控制任务的策略输出。奖励预测神经网络被配置为接收由动作选择策略神经网络生成的一个或多个中间输出并生成对应的预测奖励。训练辅助控制神经网络中的每个辅助控制神经网络和奖励预测神经网络包括调整相应的辅助控制参数、奖励预测参数和动作选择策略网络参数的值。

著录项

公开/公告号CN110114783A

专利类型发明专利
公开/公告日2019-08-09

原文格式PDF
申请/专利权人渊慧科技有限公司;
展开▼

申请/专利号CN201780080119.6
发明设计人 V.姆尼;W.扎内基;M.E.雅德伯格;T.绍尔;D.西尔弗;K.卡乌库奥格卢;
展开▼

申请日2017-11-04
分类号
代理机构北京市柳沈律师事务所;
代理人金玉洁
地址英国伦敦
入库时间 2024-02-19 13:17:43

法律信息

法律状态公告日

法律状态信息

法律状态
2019-09-03

实质审查的生效 IPC(主分类):G06N3/04 申请日:20171104

实质审查的生效
2019-08-09

公开

公开

相似文献

专利
中文文献
外文文献

1. 利用辅助任务的强化学习 [P] . 中国专利： CN110114783A . 2019-08-09
2. 一种群体感知中利用图卷积强化学习最小化信息年龄方法 [P] . 中国专利： CN113934966A . 2022-01-14
3. REINFORCEMENT LEARNING WITH AUXILIARY TASKS [P] . 美国专利： US2019258938A1 . 2019-08-22

机译：辅助任务的强化学习
4. REINFORCEMENT LEARNING WITH AUXILIARY TASKS [P] . 欧洲知识产权局专利： EP3535705A1 . 2019-09-11

机译：辅助任务的强化学习
5. Reinforcement learning with auxiliary tasks [P] . 日本专利： JP2019534517A . 2019-11-28

机译：通过辅助任务进行强化学习