首页> 中国专利> 一种实现并行任务调度的多任务强化学习方法

一种实现并行任务调度的多任务强化学习方法

页面导航

摘要
著录项
相似文献

摘要

一种实现并行任务调度的多任务强化学习方法，基于异步优势表演者批评家算法实现，包括下列操作步骤：(1)对算法模型进行设置操作以更好的解决并行多任务调度问题，包括设置状态空间、设置动作空间、设置奖励定义；(2)对算法网络进行如下改进：用深度神经网络来表示策略函数和值函数；全局网络由输入层、共享子网络和输出子网络构成；(3)设置算法的新损失函数；(4)利用采集观测的并行任务调度数据，训练算法网络，算法收敛后，将所述算法网络用于并行任务调度。

著录项

公开/公告号CN110580196B

专利类型发明专利
公开/公告日2021-04-06

原文格式PDF
申请/专利权人北京邮电大学;
展开▼

申请/专利号CN201910864432.X
发明设计人戚琦;孙海峰;王晶;张凌昕;王敬宇;廖建新;
展开▼

申请日2019-09-12
分类号G06F9/48(20060101);G06N3/08(20060101);
代理机构
代理人
地址 100876 北京市海淀区西土城路10号
入库时间 2022-08-23 11:37:53

相似文献

专利
中文文献
外文文献

1. 一种实现并行任务调度的多任务强化学习方法 [P] . 中国专利： CN110580196B . 2021.04.06
2. 一种实现并行任务调度的多任务强化学习方法 [P] . 中国专利： CN110580196A . 2019-12-17
3. Reinforcement learning methods, reinforcement learning devices and reinforcement learning programs for efficient learning [P] . 日本专利： JP2020166795A . 2020-10-08

机译：强化学习方法，强化学习设备和强化学习程序，可实现高效学习
4. A Self-directed Studying Method and the Device of It to Learn Foreign Language by the Game That Relays the End Spelling of the Word with Integrating the Merits of the Particularly Designed Cards into the Characters of Studying Machines [P] . 韩国专利： KR101332149B1 . 2013-11-21

机译：通过将单词的末尾拼写与特别设计的卡片的优点整合到学习机特征中的游戏，实现一种自主学习方法和一种学习外语的设备
5. A method of implementing an operation of switching task in a multitasking processor. [P] . BR0010602B1 . 2012-12-11

机译：一种在多任务处理器中实现切换任务的操作的方法。