JZJ站位间转运策略强化学习方法研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

目前国内外大型船舶平台越来越多地依赖计算机仿真技术对作战问题进行研究，而JZJ作为大型船舶的直接战斗力，其在作战任务中站位间的转运效率与策略对战斗力有着很大的影响。为了减少人为操作的工作量，提高某大型军工演示系统的智能性，论文借助深度强化学习的思路，而没有使用传统的人工规划路径的方式。论文通过大量的算法训练，使程序自动训练出符合JZJ运动学模型并满足出库、入库JZJ位姿要求的站位间转运策略，并将转运策略应用在了实际的作战仿真演示系统中。
　　论文首先设计实现二维场景建模工具，可以将原始仿真甲板环境迁移到强化学习环境中，为算法中场景和JZJ建模，对场景进行基于甲板实体布局的区域划分，并设计符合JZJ运动学模型的训练单位;之后根据构建强化学习中基本元素的不同方式，提出两种基于深度强化学习的研究方法，分别是动态栅格先直后曲的方法和角度区间内随机游走的方法。这两种方法分别根据JZJ最小转弯半径动态栅格化场景和求解JZJ转运时的单步转向角度区间来保证最终的转运策略符合JZJ运动学规范;接下来针对每一个研究方法，论文设计实现了两种不同的基于强化学习方法的站位间转运策略训练算法，在栅格化方法中分别使用Q-Learning和Sarsa(lambda)的算法思想得到转运的折线路径，然后使用论文中所完成的折线变曲线通用算法获得较优的转运策略。在另一个研究方法中，论文设计实现了基于DQN和DDPG的深度强化学习算法，通过算法对JZJ在甲板场景中的自由游走过程的大量训练，学习出相对较优的站位间转运策略;最后通过大量实验对两种研究方法中不同强化学习算法的训练效率与训练效果进行对比，并设计路径可视化评价工具对算法结果进行直观展示，最终建立策略评价函数对转运策略中的七个因素进行归一化评价。
　　经过大量实验与项目中的实际应用，论文设计并实现的基于深度强化学习的站位间转运策略算法满足仿真中各方面的需求，大大减少了人工编排路径的工作量，有效提升了原有仿真演示系统的智能性。

著录项

作者
刘庆猛;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机技术
授予学位硕士
导师姓名林友芳;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类军用舰艇（战舰）;计算机仿真;
关键词
军用船舶; 作战仿真演示系统; 武器装备; 甲板调度; 站位间转运策略; 深度强化学习;

相似文献

中文文献
外文文献
专利

1. 护理人员空间站位管理在手术患者转运交接中的应用 [J] . 陈正红 ,王蓓 ,吴均媛 . 中西医结合护理（中英文） . 2019,第010期
2. 护理人员空间站位管理在手术患者转运交接中的应用 [J] . 陈正红 ,王蓓 ,吴均媛 . 中西医结合护理（中英文） . 2019,第010期
3. 改进气道管理策略对危重患儿院间转运质量的影响 [J] . 马文成 ,李颖杰 ,严建江 . 实用医学杂志 . 2005,第014期
4. 基于模拟退火策略的Sarsa强化学习方法 [J] . 王现磊 ,郝文宁 ,陈刚 . 计算机仿真 . 2019,第004期
5. 基于深度强化学习的自动驾驶策略学习方法 [J] . 夏伟 ,李慧云 . 集成技术 . 2017,第003期
6. 磷脂转运蛋白介导鞘氨醇-1-磷酸在血浆脂蛋白颗粒间转运 [C] . 郭守东 ,于杨 ,刘帅 . 第11届全国脂质与脂蛋白学术会议 . 2012
7. 校正最大化偏差的异策略强化学习方法研究 [A] . 胡智慧 . 2019

JZJ站位间转运策略强化学习方法研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅