首页> 中国专利> 一种基于博弈论的移动目标防御最优防御策略选取的方法

一种基于博弈论的移动目标防御最优防御策略选取的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

发明是一种基于博弈论的移动目标防御最优防御策略选取的方法，按照如下步骤进行：建立攻防博弈模型；攻击者选择攻击策略；防御者观察到攻击策略，攻防双方计算收益；精炼贝叶斯均衡求解得出最优防御策略。其中建立攻防博弈模型的步骤还包括：定义攻防博弈模型；定义攻防收益量化。防御者观察到攻击策略，攻防双方计算收益步骤包括：防御者根据观察到的攻击策略计算后验概率；攻防双方计算各自收益。针对IDS可能发生误判、错判等情况，考虑防御策略风险收益，使收益量化更加准确，进而选取最优的防御策略。

著录项

公开/公告号CN109617863A

专利类型发明专利
公开/公告日2019-04-12

原文格式PDF
申请/专利权人杭州电子科技大学;
展开▼

申请/专利号CN201811426730.2
发明设计人张旻;李亚龙;陈勤;汤景凡;姜明;
展开▼

申请日2018-11-27
分类号
代理机构杭州君度专利代理事务所(特殊普通合伙);
代理人朱月芬
地址 310018 浙江省杭州市下沙高教园区2号大街
入库时间 2024-02-19 09:40:00

法律信息

法律状态公告日

法律状态信息

法律状态
2020-02-18

授权

授权
2019-05-07

实质审查的生效 IPC(主分类):H04L29/06 申请日:20181127

实质审查的生效
2019-04-12

公开

公开

说明书

技术领域

本文主要研究移动目标防御系统最优防御策略，是基于博弈论的移动目标防御最优防御策略选取的方法，应属于网络安全、信息安全领域。

背景技术

现有的移动目标防御最优策略选取大都基于不完全信息动态博弈建立攻防博弈模型但没有考虑入侵检测系统可能对攻击策略发生误判、错判等情况，因此本文基于不完全信息动态博弈建立模型且考虑IDS发生误判、错判时，防御者采取的防御策略对系统带来的风险，引入最小风险的贝叶斯决策思想，定义了防御者的风险收益，利用精炼贝叶斯均衡，防御者通过对攻击策略分析推断攻击者类型并修正先验推断值，进而选取最优防御策略。

发明内容

本发明针对移动目标防御系统中选取最优防御策略问题，公开一种能够在入侵检测系统发生误判、错判时仍能选出最优防御策略的方法。

为实现以上的技术目的，本发明将采取以下的技术方案：一种基于博弈论的移动目标防御最优防御策略选取的方法，按照如下步骤进行：

步骤(1)建立攻防博弈模型；

步骤(2)攻击者选择攻击策略；

步骤(3)防御者观察到攻击策略，攻防双方计算收益；

步骤(4)精炼贝叶斯均衡求解得出最优防御策略；

其中步骤(1)包括如下步骤：步骤A定义攻防博弈模型；步骤 B定义攻防收益量化；

步骤(3)包括如下步骤：步骤I防御者根据观察到的攻击策略计算后验概率；步骤II攻防双方计算各自收益。

本发明进一步限定的技术方案为：

进一步的，步骤A具体为：基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合。

进一步的，步骤B具体为：定义攻击成本AC；防御成本DC，由防御者转移攻击面成本ASSC、负面影响成本NC、和攻击识别成本AIC 三部分组成；系统损失代价SLC，表示某类攻击对目标资源的损害程度。通常使用目标资源重要程度Criticality、攻击致命度AL和安全属性损害SAD进行描述；IDS误判率P_nk，P_nk为将攻击策略a_w误判>j的概率集合；因此我们可以得到误判概率矩阵E(P)

误判损失函数λ(θ_i，d_h)，表示当攻击类型为θ_i，采取防御策略>h时的所带来的损失,可以用防御损失矩阵E(d)表示，记为

防御策略风险DSR为防御者采取防御策略时给系统带来的风险，计算公式为：

综合以上定义可得攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)

防御者收益计算公式为：U_d(a_j,d_h,θ_i)＝SLC(a_j)+AC(a_j,θ_i)->h-DSR(θ_i,a_j,d_h)

进一步的，步骤I具体为：防御者根据观察到的攻击策略计算后验概率，根据贝叶斯法则计算后验概率，后验概率计算公式为：

进一步的，步骤II具体为：攻防双方计算各自收益，攻击者收益计算公式为：U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，>i)

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h-DSR(θ_i，a_j，d_h)>

进一步的，步骤(4)具体为根据观察到的攻击策略，以及步骤 (3)中的攻防双方收益的计算，使用精炼贝叶斯均衡求解该博弈，分别可能有混同均衡和分离均衡两种解。防御者推断最优防御策略 d^*(a_j)，即通过计算

攻击者推断最优攻击策略a^*(θ)，攻击者θ预见到防御者会观察>*(a)，故选择最优攻>*(θ)，使自己的博弈收益期望U_a取最大值，即通过计算

a^*(θ)∈max>a(a，d^*(a)，θ)

精炼贝叶斯均衡求解(a^*(θ)，d^*(a)，)，针对不同的攻击策略，由于将入侵检测系统可能发生误判、错判的情况，对防御者收益量化进行了改进，更加符合实际情况，那么选取均衡解中的防御策略即为最优防御策略。

本发明有益效果如下：

在大多移动目标防御系统均使用IDS进行攻击行为检测且IDS可能会发生误判、错判的情况最终导致系统做出错误的防御策略的背景下，本发明对现有的攻防模型收益量化进行改进，将系统误判、错判情况下的收益考虑在内，更加符合实际网络情况，能保证系统在误判、错判时仍能选择最优的防御策略。

附图说明

图1是本发明所述方法的流程框图。

图2是本发明建立攻防博弈模型流程框图。

图3是本发明攻击者选择攻击策略流程框图。

图4是本发明所述攻防收益量化流程框图。

图5是本发明所述防御策略决策的流程框图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，一种基于博弈论的移动目标防御最优防御策略选取的方法，包括以下步骤：

步骤1.建立攻防博弈模型，参照图2；

1.1定义攻防博弈模型，基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合。

1.2定义攻防收益量化，定义攻击成本AC；防御成本DC；系统损失代价SLC；IDS误判率P_nk，P_nk为将攻击策略a_w误判为a_j的概率>i，d_h)，表示当攻击类型为θ_i，采取防御策略>h时的所带来的损失；防御策略风险DSR为防御者采取防御策略时给系统带来的风险；综合以上定义可得攻击者收益计算公式为：>a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)，防御者收益>d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h->i，a_j，d_h)

步骤2攻击者选择攻击策略，参照图3；

2.1“自然”按一定的概率从攻击者N_a的类型空间Θ_n中选择一个>i，攻击者N_a知道θ_i，防御者N_d不知道，但防御者N_d拥有对θ_i的推断，即防御者知道攻击类型的先验概率。

2.2攻击者N_a在观察到θ_i后从其策略空间A中选择一条攻击策>w

步骤3防御者观察到攻击策略，攻防双方计算收益，参照图4；

3.1防御者根据观察到的攻击策略计算后验概率，根据贝叶斯法则计算后验概率

3.2攻防双方计算各自收益，攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)；

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h-DSR(θ_i，a_j，d_h)；

通过攻防收益公式可计算出第一阶段的博弈树。

步骤4精炼贝叶斯均衡求解得出最优防御策略，参照图5

防御者推断最优防御策略d^*(a_j)，即通过计算

攻击者推断最优攻击策略a^*(θ)，攻击者θ预见到防御者会观察>*(a)，故选择最优攻>*(θ)，使自己的博弈收益期望U_a取最大值，即通过计算

a^*(θ)∈ max>a(a，d^*(a)，θ)

精炼贝叶斯均衡求解(a^*(θ)，d^*(a)，)，针对不同的攻击策略，由于将入侵检测系统可能发生误判、错判的情况，对防御者收益量化进行了改进，更加符合实际情况，那么选取均衡解中的防御策略即为最优防。

图1是本发明所述方法的流程框图，首先建立攻防博弈模型，定义模型内各个参数，随后在系统中攻击者发动攻击，防御者根据观察到的攻击策略，计算收益，通过精炼贝叶斯求解选择最优防御策略。

图2是本发明建立攻防博弈模型流程框图。首先基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合；随后进行模型参数初始化。

图3是本发明攻击者选择攻击策略流程框图。引入“自然”参与人，首先“自然”选择攻击类型，攻击者观察到攻击类型并选择具体的攻击策略。

图4是本发明所述攻防收益量化流程框图。防御者在观察到攻击策略后，防御者根据攻击策略计算后验概率，并计算此攻击策略下的防御策略风险收益，最终得到防御者收益。

图5是本发明所述防御策略决策的流程框图。由上图得攻防收益后推断各自最优策略，最后由精炼贝叶斯均衡求解得出最优解。御策略。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于博弈论的移动目标防御最优防御策略选取的方法 [P] . 中国专利： CN109617863B . 2020.02.18
2. 基于DS证据推理的移动目标防御最优策略选取的方法 [P] . 中国专利： CN110166437B . 2020.05.19
3. DEVICE FOR YIELDING OPTIMUM FARE BASED ON CALL BREAKDOWN INFORMATION OF MOBILE COMMUNICATION TERMINAL AND METHOD CONTROLLING THE SAME, A SYSTEM COMPRISING THE DEVICE, CAPABLE OF YIELDING OPTIMUM FARE CONSIDERING USER PATTERN OF MOBILE COMMUNICATION TERMINAL [P] . 韩国专利： KR20100065447A . 2010-06-17

机译：基于移动通信终端的呼叫中断信息的最优收益设备及其控制方法，一种包括该设备的系统，该系统能够考虑移动通信终端的用户模式来实现最优收益
4. A METHOD FOR DEVISING AN OPTIMUM CONTROL POLICY TRAINING SYSTEM CONTROL SYSTEM COMPUTER PROGRAM AND MACHINE-READABLE STORAGE MEDIUM [P] . 韩国专利： KR20190099111A . 2019-08-26

机译：一种设计最优控制策略训练系统，控制系统计算机程序和机器可读存储介质的方法
5. IMMUNIZATION STRATEGY-BASED METHOD AND DEVICE FOR TRAFFIC DATA OPTIMAL FEATURE SUBSET ACQUISITION [P] . WO2021114408A1 . 2021-06-17

机译：基于免疫策略的流量数据的方法和设备最优特征子集采集