首页> 中国专利> 基于DS证据推理的移动目标防御最优策略选取的方法

基于DS证据推理的移动目标防御最优策略选取的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于DS证据推理的移动目标防御最优策略选取的方法。本发明步骤如下：建立攻防博弈模型；攻击者选择攻击策略；防御者观察到攻击策略，攻防双方计算收益；精炼贝叶斯均衡求解得出最优防御策略；防御者通过DS证据推理修正攻击者类型后验概率。其中建立攻防博弈模型包括：定义攻防博弈模型；定义攻防收益量化。攻防双方计算收益步骤包括：防御者根据观察到的攻击策略计算后验概率；攻防双方计算各自收益；根据以往攻击记录的特征属性形成攻击类型推理决策表；根据决策表确定攻击证据的基本概率赋值。本发明弥补了现有模型中先验概率的不足之处，使防御策略收益更加合理，提高了系统前期的防御成功率。

著录项

公开/公告号CN110166437A

专利类型发明专利
公开/公告日2019-08-23

原文格式PDF
申请/专利权人杭州电子科技大学;
展开▼

申请/专利号CN201910315881.9
发明设计人张旻;李亚龙;陈勤;汤景凡;姜明;
展开▼

申请日2019-04-19
分类号
代理机构杭州君度专利代理事务所(特殊普通合伙);
代理人朱月芬
地址 310018 浙江省杭州市下沙高教园区2号大街
入库时间 2024-02-19 14:21:28

法律信息

法律状态公告日

法律状态信息

法律状态
2023-03-28

专利实施许可合同备案的生效 IPC(主分类):H04L29/06 专利申请号:2019103158819 专利号:ZL2019103158819 合同备案号:X2023330000109 让与人:杭州电子科技大学受让人:杭州绿城信息技术有限公司发明名称:基于DS证据推理的移动目标防御最优策略选取的方法申请日:20190419 申请公布日:20190823 授权公告日:20200519 许可种类:普通许可备案日期:20230311

专利实施许可合同备案的生效、变更及注销
2020-05-19

授权

授权
2019-09-17

实质审查的生效 IPC(主分类):H04L29/06 申请日:20190419

实质审查的生效
2019-08-23

公开

公开

说明书

技术领域

本发明应属于网络安全、信息安全领域，主要研究移动目标防御最优策略选取，提出一种基于DS证据推理的移动目标防御最优策略选取的方法。

背景技术

现有的移动目标防御最优策略选取大都基于不完全信息动态博弈建立攻防博弈模型，在此类模型中，防御者对攻击者类型的先验概率通常根据经验或认为指定，主观性较强，由此，对防御者的后验概率及防御策略收益计算带来影响，从而导致防御系统在前期防御成功率下降。因此，本文提出了一种基于D-S证据推理的不完全信息动态博弈模型，该模型在不完全信息动态博弈基础上，通过构建攻击类型决策表，并采用D-S证据推理的方法修正防御者对攻击类型的后验推断，使得概率更新更加客观，弥补了现有模型中先验概率的不足之处，使防御策略收益更加合理，提高了系统前期的防御成功率。

发明内容

本发明针对移动目标防御系统中选取最优防御策略问题，公开一种基于DS证据推理的移动目标防御最优策略选取的方法。一种弥补现有模型中先验概率的不足，防御者选择最优防御策略从而可提高系统前期防御成率的方法。

为实现以上的技术目的，本发明将采取以下的技术方案：

基于DS证据推理的移动目标防御最优策略选取的方法，按照如下步骤进行：

步骤(1)建立攻防博弈模型；

步骤(2)攻击者选择攻击策略；

步骤(3)防御者观察到攻击策略，攻防双方计算收益；

步骤(4)精炼贝叶斯均衡求解得出最优防御策略；

步骤(5)防御者通过DS证据推理修正攻击者类型后验概率；

其中步骤(1)具体实现如下：

步骤(1-1)：定义攻防博弈模型；

步骤(1-2)：定义攻防收益量化；

步骤(3)具体实现如下：

步骤(3-1)：防御者根据观察到的攻击策略计算后验概率；

步骤(3-2)：攻防双方计算各自收益。

步骤(5)具体实现如下：

步骤(5-1)：根据以往攻击记录的特征属性形成攻击类型推理决策表；

步骤(5-2)：根据决策表确定攻击证据的基本概率赋值(BPA)；

步骤(5-3)：根据D-S证据推理方法合成证据；

步骤(5-4)：根据证据组合后的BPA进行pignistic概率转换，得到攻击者的类型θ_i的后验概率。

本发明进一步限定的技术方案为：

步骤(1-1)具体为：基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合。

进一步的，步骤(1-2)具体为：定义攻击成本AC；防御成本DC，由防御者转移攻击面成本ASSC、负面影响成本NC和攻击识别成本AIC三部分组成；系统损失代价SLC，表示某类攻击对目标资源的损害程度。通常使用目标资源重要程度Criticaiity、攻击致命度AL和安全属性损害SAD进行描述；

综合以上定义可得攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)

其中，攻击者包含n种攻击类型，θ_i为攻击者类型，1≤i≤n，攻击者可选择m种攻击策略，a_j为攻击策略，1≤j≤m，防御者可选择k种攻击策略，d_h为防御策略，1≤h≤k。

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h

进一步的，步骤(3-1)具体为：防御者根据观察到的攻击策略计算后验概率，根据贝叶斯法则计算后验概率，后验概率计算公式为：

进一步的，步骤(3-2)具体为：攻防双方计算各自收益。

攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)；

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h

通过攻防收益公式可计算出第一阶段的博弈树。

进一步的，步骤(4)具体为根据观察到的攻击策略，以及步骤(3)中的攻防双方收益的计算，使用精炼贝叶斯均衡求解该博弈，分别可能有混同均衡和分离均衡两种解。防御者推断最优防御策略d^*(a_j)，即通过计算

攻击者推断最优攻击策略a^*(θ_i)，攻击者θ预见到防御者会观察到自己的攻击策略a的基础上，选择最优策略d^*(a_j)，故选择最优攻击策略a^*(θ_i)，使自己的博弈收益期望U_a取最大值，即通过计算

a^*(θ_i)∈max>a(a_j，d_h，θ_i)

精炼贝叶斯均衡求解

进一步的，步骤(5-1)具体为：根据以往攻击记录的特征属性形成攻击类型推理决策表。根据攻击记录中各证据的数值以及不同数值的组合下对应的攻击者类型不同，将其记录下来，形成决策表，证据使用c_k表示，攻击类型使用θ_u1表示。

进一步的，步骤(5-2)具体为：

根据决策表确定该攻击策略中各证据的基本概率赋值(BPA)。防御者根据检测到攻击证据集中c_k的值，将与c_k值相同的历史记录从对应的U/{c_k，θ_ur}中划分出来，计作B_k，最后按照B_k中历史记录u对应的攻击类型不同，将B_k划分为B_k＝{{B_k1}，{B_k2}，...{B_kz}}，那么c_k对B_k中各类型的决策规则强度计算公式为：

c_k对B_k中所有攻击类型的扩充决策规则强度计算公式为：

证据c_k对应的各攻击类型的基本概率赋值为：

证据c_k对所有攻击类型的基本概率赋值为：

进一步的，步骤(5-3)具体为：

k个证据c_k，为其基本概率赋值，那么k个证据组合规则为：

进一步的，步骤(5-4)具体为：

对步骤(5-3)所得的组合后的BPA进行pignistic概率转换，得到攻击者的类型θ_i的后验概率。其中pignistic概率转换公式为：

本发明有益效果如下：

现有模型中防御者的先验概率通常根据经验或认为指定，主观性较强，由此，对防御者的后验概率及防御策略收益计算带来影响，从而导致防御系统在前期防御成功率下降。本文提出了一种基于D-S证据推理的不完全信息动态博弈模型，该模型在不完全信息动态博弈基础上，通过构建攻击类型决策表，并采用D-S证据推理的方法修正防御者对攻击类型的后验推断，使得概率更新更加客观，弥补了现有模型中先验概率的不足之处，使防御策略收益更加合理，提高了系统前期的防御成功率。

附图说明

图1是本发明所述方法的流程框图。

图2是本发明建立攻防博弈模型流程框图。

图3是本发明攻击者选择攻击策略流程框图。

图4是本发明所述攻防收益量化流程框图

图5是本发明所述防御策略决策的流程框图。

图6是本发明所述防御者修正攻击类型后验概率流程框图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

如图1所示，首先建立攻防博弈模型，定义模型内各个参数，随后在系统中攻击者发动攻击，防御者根据观察到的攻击策略，计算收益，通过精炼贝叶斯求解选择最优防御策略。

如图2所示为本发明建立攻防博弈模型流程框图。首先基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合；随后进行模型参数初始化。

如图3所示为本发明攻击者选择攻击策略流程框图。引入“自然”参与人，首先“自然”选择攻击类型，攻击者观察到攻击类型并选择具体的攻击策略。

如图4所示为本发明所述攻防收益量化流程框图。防御者在观察到攻击策略后，防御者根据攻击策略计算后验概率，并计算此攻击策略下的防御策略风险收益，最终得到防御者收益。

如图5所示为本发明所述防御策略决策的流程框图。由上图得攻防收益后推断各自最优策略，最后由精炼贝叶斯均衡求解得出最优解。如图6所示为本发明所述防御者修正攻击类型后验概率，为下一步攻防做准备。

参照图1，一种基于博弈论的移动目标防御最优防御策略选取的方法，包括以下步骤：

步骤1.建立攻防博弈模型，参照图2；

1.1定义攻防博弈模型，基于不完全信息动态博弈建立博弈模型，模型使用八元组描述。分别对应博弈参与者、参与者的类型空间、攻击策略集、防御策略集、先验概率集合、后验概率集合、收益函数集合。

1.2定义攻防收益量化，定义攻击成本AC；防御成本DC；系统损失代价SLC；综合以上定义可得攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)；

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h；

步骤2攻击者选择攻击策略，参照图3；

2.1“自然”按一定的概率从攻击者N_a的类型空间Θ_n中选择一个类型θ_i，攻击者N_a知道θ_i，防御者N_d不知道，但防御者N_d拥有对θ_i的推断，即防御者知道攻击类型的先验概率。

2.2攻击者N_a在观察到θ_i后从其策略空间A中选择一条攻击策略a_w

步骤3.防御者观察到攻击策略，攻防双方计算收益，参照图4；

3.1防御者根据观察到的攻击策略计算后验概率，根据贝叶斯法则计算后验概率

3.2攻防双方计算各自收益，攻击者收益计算公式为：

U_a(θ_i，a_j，d_h)＝SLC(a_j)+DC(d_h，θ_i)-AC(a_j，θ_i)；

防御者收益计算公式为：

U_d(a_j，d_h，θ_i)＝SLC(a_j)+AC(a_j，θ_i)-DC_h；

通过攻防收益公式可计算出第一阶段的博弈树。

步骤4精炼贝叶斯均衡求解得出最优防御策略，参照图5

防御者推断最优防御策略d^*(a_j)，即通过计算

攻击者推断最优攻击策略a^*(θ)，攻击者θ预见到防御者会观察到自己的攻击策略a的基础上，选择最优策略d^*(a)，故选择最优攻击策略a^*(θ)，使自己的博弈收益期望U_a取最大值，即通过计算

a^*(θ_i)∈max>a(a_j，d_h，θ_i)

精炼贝叶斯均衡求解针对不同的攻击策略，由于将入侵检测系统可能发生误判、错判的情况，对防御者收益量化进行了改进，更加符合实际情况，那么选取均衡解中的防御策略即为最优防御策略。

步骤5防御者使用DS正推推理修正攻击类型后验概率，参照图6

5.1：根据以往攻击记录的特征属性形成攻击类型推理决策表。根据攻击记录中各证据的数值以及不同数值的组合下对应的攻击者类型不同，将其记录下来，形成决策表，证据使用c_k表示，攻击类型使用θ_u1表示。

5.2根据决策表确定该攻击策略中各证据的基本概率赋值(BPA)。防御者根据检测到攻击证据集中c_k的值，将与c_k值相同的历史记录从对应的U/{c_k，θ_ur}中划分出来，计作B_k，最后按照B_k中历史记录u对应的攻击类型不同，将B_k划分为B_k＝{{B_k1}，{B_k2}，...{B_kz}}，那么c_k对B_k中各类型的决策规则强度计算公式为：

c_k对B_k中所有攻击类型的扩充决策规则强度计算公式为：

证据c_k对应的各攻击类型的基本概率赋值为：

证据c_k对所有攻击类型的基本概率赋值为：

5.3：k个证据c_k，为其基本概率赋值，那么k个证据组合规则为：

5.4：对步骤③所得的组合后的BPA进行pignistic概率转换，得到攻击者的类型θ_i的后验概率。其中pignistic概率转换公式为：

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于DS证据推理的移动目标防御最优策略选取的方法 [P] . 中国专利： CN110166437B . 2020.05.19
2. 基于DS证据推理的移动目标防御最优策略选取的方法 [P] . 中国专利： CN110166437A . 2019-08-23
3. METHOD FOR PROVIDING OPTIMAL ROUTE DYNAMICALLY BASED UPON DSRC IN TRAFFIC SYNTHESIS MANAGEMENT SYSTEM [P] . 韩国专利： KR100681124B1 . 2007-02-08

机译：交通综合管理系统中基于DSRC的基于动态路由的最优路由提供方法
4. METHOD FOR PROVIDING OPTIMAL ROUTE DYNAMICALLY BASED UPON DSRC IN TRAFFIC SYNTHESIS MANAGEMENT SYSTEM [P] . 韩国专利： KR20010084335A . 2001-09-06

机译：交通综合管理系统中基于DSRC的基于动态路由的最优路由提供方法
5. IMMUNIZATION STRATEGY-BASED METHOD AND DEVICE FOR TRAFFIC DATA OPTIMAL FEATURE SUBSET ACQUISITION [P] . WO2021114408A1 . 2021-06-17

机译：基于免疫策略的流量数据的方法和设备最优特征子集采集