基于深度强化学习的舰载机在线调度方法研究

于彤彤; 董婷婷; 肖创柏

首页> 中文期刊>高技术通讯 >基于深度强化学习的舰载机在线调度方法研究

基于深度强化学习的舰载机在线调度方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统调度算法在高危多变环境下实现多目标在线调度所面临的困境,提出基于深度强化学习的调度优化算法,并应用于大规模舰载机出动回收多目标在线调度问题中.该方法以减小舰面位移、减少会遇次数、均衡设备利用率和稳定调度周期作为调度决策目标,依照马尔可夫决策过程(MDP),构造以舰载机和各设备状态作为输入,调度行为动作作为输出,带权特征向量作为奖赏的在线调度即时决策模型.搭建用于训练的优化深度强化学习网络,改进动作选择策略和网络结构以提升性能,从而实现在线调度决策优化.实验结果表明,利用该方法得到的决策模型能够在线解决突发状况,在静态和动态调度方面,相对于启发式算法和调度规则本文方法在安全性和高效性方面具有优势.

著录项

来源
《高技术通讯》|2021年第4期|367-377|共11页
作者
于彤彤; 董婷婷; 肖创柏;
展开▼
作者单位

北京工业大学信息学部北京100124;

北京工业大学信息学部北京100124;

北京工业大学信息学部北京100124;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
深度强化学习; 舰载机出动回收; 在线调度; 多目标决策;
入库时间 2022-08-20 04:49:23

相似文献

中文文献
外文文献
专利

1. 基于深度强化学习的舰载机动态避障方法 [J] . 薛均晓 ,孔祥燕 ,郭毅博 . 计算机辅助设计与图形学学报 . 2021,第007期
2. 基于快速需求响应的城市公交在线调度方法研究 [J] . 杨海军 ,贺国光 . 武汉理工大学学报（交通科学与工程版） . 2009,第003期
3. 基于深度强化学习的医用设备应急调度优化技术研究 [J] . 夏天 ,黄冠 ,李颖 . 电子设计工程 . 2022,第3期
4. 基于深度强化学习的物联网传输数据实时调度方法 [J] . 张继飞 ,赵玉超 ,张春红 . 通信电源技术 . 2021,第003期
5. 基于深度强化学习的非置换流水车间调度问题 [J] . 肖鹏飞 ,张超勇 ,孟磊磊 . 计算机集成制造系统 . 2021,第001期
6. 一种基于在线仿真的多无人机任务调度方法研究 [C] . ZHAO Hong-wei ,赵宏伟 ,XU Jin-zhou . 2009年中国高校通信类院系学术研讨会 . 2009
7. 基于深度强化学习的飞行目标探测传感器资源调度方法研究 [A] . 梁皓星 . 2020

基于深度强化学习的舰载机在线调度方法研究

摘要

著录项

相似文献

相关主题

期刊订阅