首页> 中国专利> 基于深度强化学习的舰载机保障作业人员调度方法

基于深度强化学习的舰载机保障作业人员调度方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于深度强化学习的舰载机保障作业人员调度方法，包括以下步骤：构建舰载机保障过程的马尔可夫决策过程(Markov Decision Process,MDP)模型，作为智能体训练环境；根据保障作业流程，确定智能体及其观测空间与动作空间；随后设计奖励函数、经验抽取机制和终止条件，并基于此设计网络结构；通过设置主要参数初始化环境，并采用多智能体深度确定策略梯度算法(Multi Agent Deep Deterministic Policy Gradient,MADDPG)训练智能体；最终使用完成训练智能体的决策辅助指挥人员进行保障作业人员调度。本发明可用于人员调度智能决策，将各类保障小组设定为智能体，辅助指挥人员和保障人员进行决策，提高保障作业决策效率，从而提高舰载机出动回收架次率。

著录项

公开/公告号CN113706023B

专利类型发明专利
公开/公告日2022-07-12

原文格式PDF
申请/专利权人哈尔滨理工大学;
展开▼

申请/专利号CN202111009089.4
发明设计人栾添添;付强;孙明晓;原张杰;张文玉;王万鹏;胡占永;谢春旺;
展开▼

申请日2021-08-31
分类号G06Q10/06;G06N3/08;G06K9/62;G06F30/27;G06F30/15;
代理机构
代理人
地址 150080 黑龙江省哈尔滨市南岗区学府路52号哈尔滨理工大学
入库时间 2022-09-06 00:34:49

法律信息

法律状态公告日

法律状态信息

法律状态
2022-07-12

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习的舰载机保障作业人员调度方法 [P] . 中国专利： CN113706023B . 2022.07.12
2. 基于深度强化学习的舰载机保障作业人员调度方法 [P] . 中国专利： CN113706023A . 2021-11-26
3. MODEL-ASSISTED DEEP REINFORCEMENT LEARNING BASED SCHEDULING IN WIRELESS NETWORKS [P] . 韩国专利： KR20220047408A . 2022-04-15

机译：无线网络中基于模型辅助的深度强化学习调度
4. A facility- simulator based job scheduling system using reinforcement deep learning [P] . 韩国专利： KR102338304B1 . 2021-12-13

机译：基于工厂的模拟器使用加强深度学习的作业调度系统
5. A facility- simulator based job scheduling system using reinforcement deep learning [P] . 韩国专利： KR20210099932A . 2021-08-13

机译：基于工厂的模拟器使用强化深度学习的作业调度系统