首页> 中国专利> 一种基于Ray的分布式强化学习方法及装置

一种基于Ray的分布式强化学习方法及装置

页面导航

摘要
著录项
相似文献

摘要

本申请属于强化学习技术领域，具体涉及一种基于Ray的分布式强化学习方法及装置。该方法包括步骤S1、接收设置在各采样节点的远端采样函数发送来的训练数据，并存储于缓冲池；步骤S2、定期轮询缓冲池的训练数据，待训练数据之和满足数量要求之后，通知并等待所有采样节点结束采样；步骤S3、获取模型参数，并基于所述训练数据对模型进行训练，返回训练后的模型参数；步骤S4、清空所述缓冲池的数据，重复进行采样及训练的强化学习过程。本申请有效的提升强化学习算法的训练效果并降低了训练时间。

著录项

公开/公告号CN113920388A

专利类型发明专利
公开/公告日2022-01-11

原文格式PDF
申请/专利权人中国航空工业集团公司沈阳飞机设计研究所;
展开▼

申请/专利号CN202111070913.7
发明设计人樊松源;朴海音;孙智孝;孙阳;于津;彭宣淇;韩玥;杨晟琦;詹光;郎魁军;
展开▼

申请日2021-09-13
分类号G06V10/774(20220101);G06K9/62(20220101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11526 北京航信高科知识产权代理事务所(普通合伙);
代理人刘传准
地址 110035 辽宁省沈阳市皇姑区塔湾街40号
入库时间 2023-06-19 13:51:08

相似文献

专利
中文文献
外文文献

1. 一种基于Ray的分布式强化学习方法及装置 [P] . 中国专利： CN113920388A . 2022-01-11
2. 一种基于融合神经网络参数的分布式深度强化学习方法 [P] . 中国专利： CN110490319B . 2020.06.26
3. DISTRIBUTED STRENGTHENING LEARNING METHOD FOR INTEGRATING EXPERIENCE STRENGTHENING TYPE STRENGTHENING LEARNING METHOD AND ENVIRONMENT IDENTIFICATION TYPE STRENGTHENING LEARNING METHOD BY USING MULTI-AGENT MODEL [P] . 日本专利： JP2000020494A . 2000-01-21

机译：综合多经验模型的经验强化型强化学习方法与环境识别型强化学习方法的分布式强化学习方法
4. DISTRIBUTED REINFORCEMENT LEARNING SYSTEM, AND DISTRIBUTED REINFORCEMENT LEARNING METHOD [P] . WO2022004601A1 . 2022-01-06

机译：分布式钢筋学习系统，以及分布式强化学习方法
5. REINFORCEMENT LEARNING METHOD BASED ON LINEAR MODEL, DEVICE THEREFOR AND PROGRAM [P] . 日本专利： JP2014206795A . 2014-10-30

机译：基于线性模型的强化学习方法，装置参考和程序