法律状态公告日
法律状态信息
法律状态
2020-02-18
授权
授权
2019-05-07
实质审查的生效 IPC(主分类):H04L29/06 申请日:20181127
实质审查的生效
2019-04-12
公开
公开
技术领域
本文主要研究移动目标防御系统最优防御策略,是基于博弈论的 移动目标防御最优防御策略选取的方法,应属于网络安全、信息安全 领域。
背景技术
现有的移动目标防御最优策略选取大都基于不完全信息动态博 弈建立攻防博弈模型但没有考虑入侵检测系统可能对攻击策略发生 误判、错判等情况,因此本文基于不完全信息动态博弈建立模型且考 虑IDS发生误判、错判时,防御者采取的防御策略对系统带来的风险, 引入最小风险的贝叶斯决策思想,定义了防御者的风险收益,利用精 炼贝叶斯均衡,防御者通过对攻击策略分析推断攻击者类型并修正先 验推断值,进而选取最优防御策略。
发明内容
本发明针对移动目标防御系统中选取最优防御策略问题,公开一 种能够在入侵检测系统发生误判、错判时仍能选出最优防御策略的方 法。
为实现以上的技术目的,本发明将采取以下的技术方案:一种基 于博弈论的移动目标防御最优防御策略选取的方法,按照如下步骤进 行:
步骤(1)建立攻防博弈模型;
步骤(2)攻击者选择攻击策略;
步骤(3)防御者观察到攻击策略,攻防双方计算收益;
步骤(4)精炼贝叶斯均衡求解得出最优防御策略;
其中步骤(1)包括如下步骤:步骤A定义攻防博弈模型;步骤 B定义攻防收益量化;
步骤(3)包括如下步骤:步骤I防御者根据观察到的攻击策略 计算后验概率;步骤II攻防双方计算各自收益。
本发明进一步限定的技术方案为:
进一步的,步骤A具体为:基于不完全信息动态博弈建立博弈模 型,模型使用八元组
进一步的,步骤B具体为:定义攻击成本AC;防御成本DC,由 防御者转移攻击面成本ASSC、负面影响成本NC、和攻击识别成本AIC 三部分组成;系统损失代价SLC,表示某类攻击对目标资源的损害程 度。通常使用目标资源重要程度Criticality、攻击致命度AL和安全属性损害SAD进行描述;IDS误判率Pnk,Pnk为将攻击策略aw误判>j的概率集合;因此我们可以得到误判概率矩阵E(P)
误判损失函数λ(θi,dh),表示当攻击类型为θi,采取防御策略>h时的所带来的损失,可以用防御损失矩阵E(d)表示,记为
防御策略风险DSR为防御者采取防御策略时给系统带来的风险, 计算公式为:
综合以上定义可得攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi)
防御者收益计算公式为:Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)->h-DSR(θi,aj,dh)
进一步的,步骤I具体为:防御者根据观察到的攻击策略计算 后验概率,根据贝叶斯法则计算后验概率,后验概率计算公式为:
进一步的,步骤II具体为:攻防双方计算各自收益,攻击者收 益计算公式为:Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,>i)
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh-DSR(θi,aj,dh)>
进一步的,步骤(4)具体为根据观察到的攻击策略,以及步骤 (3)中的攻防双方收益的计算,使用精炼贝叶斯均衡求解该博弈, 分别可能有混同均衡和分离均衡两种解。防御者推断最优防御策略 d*(aj),即通过计算
攻击者推断最优攻击策略a*(θ),攻击者θ预见到防御者会观察>*(a),故选择最优攻>*(θ),使自己的博弈收益期望Ua取最大值,即通过计算
a*(θ)∈max>a(a,d*(a),θ)
精炼贝叶斯均衡求解(a*(θ),d*(a),
本发明有益效果如下:
在大多移动目标防御系统均使用IDS进行攻击行为检测且IDS可 能会发生误判、错判的情况最终导致系统做出错误的防御策略的背景 下,本发明对现有的攻防模型收益量化进行改进,将系统误判、错判 情况下的收益考虑在内,更加符合实际网络情况,能保证系统在误判、 错判时仍能选择最优的防御策略。
附图说明
图1是本发明所述方法的流程框图。
图2是本发明建立攻防博弈模型流程框图。
图3是本发明攻击者选择攻击策略流程框图。
图4是本发明所述攻防收益量化流程框图。
图5是本发明所述防御策略决策的流程框图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于博弈论的移动目标防御最优防御策略选取的 方法,包括以下步骤:
步骤1.建立攻防博弈模型,参照图2;
1.1定义攻防博弈模型,基于不完全信息动态博弈建立博弈模型, 模型使用八元组
1.2定义攻防收益量化,定义攻击成本AC;防御成本DC;系统 损失代价SLC;IDS误判率Pnk,Pnk为将攻击策略aw误判为aj的概率>i,dh),表示当攻击类型为θi,采取防御策略>h时的所带来的损失;防御策略风险DSR为防御者采取防御策略 时给系统带来的风险;综合以上定义可得攻击者收益计算公式为:>a(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi),防御者收益>d(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh->i,aj,dh)
步骤2攻击者选择攻击策略,参照图3;
2.1“自然”按一定的概率从攻击者Na的类型空间Θn中选择一个>i,攻击者Na知道θi,防御者Nd不知道,但防御者Nd拥有对θi的推断,即防御者知道攻击类型的先验概率。
2.2攻击者Na在观察到θi后从其策略空间A中选择一条攻击策>w
步骤3防御者观察到攻击策略,攻防双方计算收益,参照图4;
3.1防御者根据观察到的攻击策略计算后验概率,根据贝叶斯法 则计算后验概率
3.2攻防双方计算各自收益,攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi);
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh-DSR(θi,aj,dh);
通过攻防收益公式可计算出第一阶段的博弈树。
步骤4精炼贝叶斯均衡求解得出最优防御策略,参照图5
防御者推断最优防御策略d*(aj),即通过计算
攻击者推断最优攻击策略a*(θ),攻击者θ预见到防御者会观察>*(a),故选择最优攻>*(θ),使自己的博弈收益期望Ua取最大值,即通过计算
a*(θ)∈ max>a(a,d*(a),θ)
精炼贝叶斯均衡求解(a*(θ),d*(a),
图1是本发明所述方法的流程框图,首先建立攻防博弈模型,定 义模型内各个参数,随后在系统中攻击者发动攻击,防御者根据观察 到的攻击策略,计算收益,通过精炼贝叶斯求解选择最优防御策略。
图2是本发明建立攻防博弈模型流程框图。首先基于不完全信息 动态博弈建立博弈模型,模型使用八元组描述。分别 对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先 验概率集合、后验概率集合、收益函数集合;随后进行模型参数初始 化。
图3是本发明攻击者选择攻击策略流程框图。引入“自然”参与 人,首先“自然”选择攻击类型,攻击者观察到攻击类型并选择具体 的攻击策略。
图4是本发明所述攻防收益量化流程框图。防御者在观察到攻击 策略后,防御者根据攻击策略计算后验概率,并计算此攻击策略下的 防御策略风险收益,最终得到防御者收益。
图5是本发明所述防御策略决策的流程框图。由上图得攻防收益 后推断各自最优策略,最后由精炼贝叶斯均衡求解得出最优解。 御策略。
机译: 基于移动通信终端的呼叫中断信息的最优收益设备及其控制方法,一种包括该设备的系统,该系统能够考虑移动通信终端的用户模式来实现最优收益
机译: 一种设计最优控制策略训练系统,控制系统计算机程序和机器可读存储介质的方法
机译: 基于免疫策略的流量数据的方法和设备最优特征子集采集