融合有效方差置信上界的Q学习智能干扰决策算法

饶宁; 许华; 宋佰霖

首页> 中文期刊>哈尔滨工业大学学报 >融合有效方差置信上界的Q学习智能干扰决策算法

融合有效方差置信上界的Q学习智能干扰决策算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信度较低的干扰动作,减少干扰方在未知环境中不必要的探索成本,加快其在干扰动作空间的搜索速度,并同步更新所有干扰动作的价值,进而加速学习最优干扰策略.通过将干扰决策场景建模为马尔科夫决策过程进行仿真实验,所构造的干扰实验结果表明:当通信方使用干扰方未知的干扰躲避策略变更通信波道时,与现有基于强化学习的干扰决策算法相比,该算法在无通信方的先验信息条件下,收敛速度更快,可达到更高的干扰成功率,获得更大的干扰总收益.此外,该算法还适用于"多对多"协同对抗环境,可利用动作剔除方法降低联合干扰动作的空间维度,相同实验条件下,其干扰成功率比传统Q学习决策算法高50％以上.

著录项

来源
《哈尔滨工业大学学报》|2022年第5期|162-170|共9页
作者
饶宁; 许华; 宋佰霖;
展开▼
作者单位

空军工程大学信息与导航学院西安710077;

空军工程大学信息与导航学院西安710077;

空军工程大学信息与导航学院西安710077;

展开▼
原文格式 PDF
正文语种 chi
中图分类通信电子对抗;
关键词
干扰决策; 强化学习; 有效方差置信上界; Q学习; 干扰动作剔除; 马尔科夫决策过程;
入库时间 2022-08-20 11:47:19

相似文献

中文文献
外文文献
专利

1. 融合动作剔除的深度竞争双Q网络智能干扰决策算法 [J] . 饶宁 ,许华 ,宋佰霖 . 空军工程大学学报（自然科学版） . 2021,第004期
2. 融合改进强化学习的认知无线电抗干扰决策算法 [J] . 朱芮 ,马永涛 ,南亚飞 . 计算机科学与探索 . 2019,第004期
3. 融合改进强化学习的认知无线电抗干扰决策算法 [J] . 朱芮 ,马永涛 ,南亚飞 . 计算机科学与探索 . 2019,第004期
4. 群智能算法优化的结合熵的最大类间方差法与脉冲耦合神经网络融合的图像分割算法 [J] . 程述立 ,汪烈军 ,秦继伟 . 计算机应用 . 2017,第012期
5. 一种基于可传递置信模型的分布智能体决策融合方法 [J] . 范波 ,普杰信 ,刘刚 . 计算机应用研究 . 2010,第002期
6. 测量方差自学习加权下的多传感器融合算法 [C] . 胡振涛 ,刘先省 . 2004全国图像传感器技术学术交流会 . 2004
7. 融合先验的贝叶斯网络结构学习及其在智能决策中的应用 [A] . 叶思懋 . 2018

融合有效方差置信上界的Q学习智能干扰决策算法

摘要

著录项

相似文献

相关主题

期刊订阅