首页> 中文期刊>武汉大学学报:理学版 >基于马尔可夫决策过程的动态目标防御策略优化方法

基于马尔可夫决策过程的动态目标防御策略优化方法

     

摘要

动态目标防御技术作为"改变游戏规则"的防御技术,在对抗高级持续威胁中提供了一种主动变换的防御方法。虽然已有部分动态防御技术成功应用,但针对其变化策略的研究和优化还停留在单层次、单参数上,阻碍了多层次融合的动态防御技术应用于实际部署。针对该问题,从系统角度分析了动态目标防御技术中不同参数对系统的影响,建立了系统正常服务与重配置过程模型,在此基础上,提出了基于马尔可夫决策过程的动态目标防御策略优化方法,引入Q-learning算法生成了优化策略集合,解决了多层次多变化参数集合的动态防御技术的策略优化问题。仿真实验表明,利用本文提出的优化模型和算法,计算出了优化后的动态目标防御重配置策略,该优化策略能够较好地平衡系统的可用性和安全性,指导今后动态目标防御技术实际部署问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号