基于预测编码的样本自适应行动策略规划

梁星星; 马扬; 冯旸赫; 张驭龙; 张龙飞; 廖世江; 刘忠

首页> 中文期刊>软件学报 >基于预测编码的样本自适应行动策略规划

基于预测编码的样本自适应行动策略规划

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

军事行动、反恐突击等强对抗场景中,实时信息的碎片化、不确定性对制定具有博弈优势的弹性行动方案提出了更高的要求,研究具有自学习能力的智能行动策略规划方法已成为编队级强对抗任务的核心问题.针对复杂场景下行动策略规划状态表征困难、数据效率低下等问题,提出了基于预测编码的样本自适应行动策略规划方法.利用自编码模型压缩表示任务的原始状态空间,通过任务环境的状态转移样本,在低维度状态空间中使用混合密度分布网络对任务环境的动态模型进行学习,获得了表征环境动态性的预测编码;基于预测编码展开行动策略规划研究,利用时间差分敏感的样本自适应方法对状态评估值函数进行预测,改善了数据效率,加速了算法收敛.为了验证算法的有效性,基于全国兵棋推演大赛机机挑战赛的想定,构建了包含大赛获奖选手操作策略的5种规则智能体,利用消融实验验证编码方式、样本采样策略等不同因子组合对算法的影响,并使用Elo评分机制对各个智能体进行排序;实验结果表明:基于预测编码的样本自适应算法——MDN-AF得分排序最高,对战平均胜率为71%,其中大比分获胜局占比为67.6%,而且学习到了自主波次划分、补充侦察策略、“蛇形”打击策略、轰炸机靠后突袭等4种长时行动策略.该算法框架应用于2020年全国兵棋推演大赛的智能体开发,并获得了全国一等奖.

著录项

来源
《软件学报》|2022年第4期|1477-1500|共24页
作者
梁星星; 马扬; 冯旸赫; 张驭龙; 张龙飞; 廖世江; 刘忠;
展开▼
作者单位

国防科技大学系统工程学院;

31002部队;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
行动规划; 强化学习; 兵棋推演; 预测编码; 样本自适应;
入库时间 2022-09-15 21:43:57

相似文献

中文文献
外文文献
专利

1. 基于LMS的图像自适应预测编码 [J] . 肖化超 ,周诠 . 电子设计工程 . 2011,第004期
2. 基于联想记忆的彩色图像自适应预测编码方法 [J] . 李云栋 ,张其善 . 信号处理 . 2006,第002期
3. 空时自适应处理中基于知识的训练样本选择策略 [J] . 周宇 ,张林让 ,刘楠 . 系统工程与电子技术 . 2010,第002期
4. 基于自适应样本选择策略的两阶段CEBoosting方法 [J] . 杨会志 ,陈军霞 ,鲍智文 . 中国科技信息 . 2005,第013期
5. 非平衡样本集下公私合作(PPP)可融资性评价——基于改进边界样本自适应算法 [J] . 沈俊鑫 ,程墙 ,吴以 . 科技管理研究 . 2021,第016期
6. 基于城铁联动发展理念的规划预先控制——沈阳地铁4、9、10号线沿线优化规划总体策略与行动指引 [C] . 李晓宇 . 2014中国城市规划年会 . 2014
7. 基于自适应动态规划控制策略的混合动力电动汽车能量管理研究 [A] . 刘洋 . 2018

基于预测编码的样本自适应行动策略规划

摘要

著录项

相似文献

相关主题

期刊订阅