法律状态公告日
法律状态信息
法律状态
2023-03-28
专利实施许可合同备案的生效 IPC(主分类):H04L29/06 专利申请号:2019103158819 专利号:ZL2019103158819 合同备案号:X2023330000109 让与人:杭州电子科技大学 受让人:杭州绿城信息技术有限公司 发明名称:基于DS证据推理的移动目标防御最优策略选取的方法 申请日:20190419 申请公布日:20190823 授权公告日:20200519 许可种类:普通许可 备案日期:20230311
专利实施许可合同备案的生效、变更及注销
2020-05-19
授权
授权
2019-09-17
实质审查的生效 IPC(主分类):H04L29/06 申请日:20190419
实质审查的生效
2019-08-23
公开
公开
技术领域
本发明应属于网络安全、信息安全领域,主要研究移动目标防御最优策略选取,提出一种基于DS证据推理的移动目标防御最优策略选取的方法。
背景技术
现有的移动目标防御最优策略选取大都基于不完全信息动态博弈建立攻防博弈模型,在此类模型中,防御者对攻击者类型的先验概率通常根据经验或认为指定,主观性较强,由此,对防御者的后验概率及防御策略收益计算带来影响,从而导致防御系统在前期防御成功率下降。因此,本文提出了一种基于D-S证据推理的不完全信息动态博弈模型,该模型在不完全信息动态博弈基础上,通过构建攻击类型决策表,并采用D-S证据推理的方法修正防御者对攻击类型的后验推断,使得概率更新更加客观,弥补了现有模型中先验概率的不足之处,使防御策略收益更加合理,提高了系统前期的防御成功率。
发明内容
本发明针对移动目标防御系统中选取最优防御策略问题,公开一种基于DS证据推理的移动目标防御最优策略选取的方法。一种弥补现有模型中先验概率的不足,防御者选择最优防御策略从而可提高系统前期防御成率的方法。
为实现以上的技术目的,本发明将采取以下的技术方案:
基于DS证据推理的移动目标防御最优策略选取的方法,按照如下步骤进行:
步骤(1)建立攻防博弈模型;
步骤(2)攻击者选择攻击策略;
步骤(3)防御者观察到攻击策略,攻防双方计算收益;
步骤(4)精炼贝叶斯均衡求解得出最优防御策略;
步骤(5)防御者通过DS证据推理修正攻击者类型后验概率;
其中步骤(1)具体实现如下:
步骤(1-1):定义攻防博弈模型;
步骤(1-2):定义攻防收益量化;
步骤(3)具体实现如下:
步骤(3-1):防御者根据观察到的攻击策略计算后验概率;
步骤(3-2):攻防双方计算各自收益。
步骤(5)具体实现如下:
步骤(5-1):根据以往攻击记录的特征属性形成攻击类型推理决策表;
步骤(5-2):根据决策表确定攻击证据的基本概率赋值(BPA);
步骤(5-3):根据D-S证据推理方法合成证据;
步骤(5-4):根据证据组合后的BPA进行pignistic概率转换,得到攻击者的类型θi的后验概率。
本发明进一步限定的技术方案为:
步骤(1-1)具体为:基于不完全信息动态博弈建立博弈模型,模型使用八元组
进一步的,步骤(1-2)具体为:定义攻击成本AC;防御成本DC,由防御者转移攻击面成本ASSC、负面影响成本NC和攻击识别成本AIC三部分组成;系统损失代价SLC,表示某类攻击对目标资源的损害程度。通常使用目标资源重要程度Criticaiity、攻击致命度AL和安全属性损害SAD进行描述;
综合以上定义可得攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi)
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
进一步的,步骤(3-1)具体为:防御者根据观察到的攻击策略计算后验概率,根据贝叶斯法则计算后验概率,后验概率计算公式为:
进一步的,步骤(3-2)具体为:攻防双方计算各自收益。
攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi);
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
通过攻防收益公式可计算出第一阶段的博弈树。
进一步的,步骤(4)具体为根据观察到的攻击策略,以及步骤(3)中的攻防双方收益的计算,使用精炼贝叶斯均衡求解该博弈,分别可能有混同均衡和分离均衡两种解。防御者推断最优防御策略d*(aj),即通过计算
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
攻击者推断最优攻击策略a*(θi),攻击者θ预见到防御者会观察到自己的攻击策略a的基础上,选择最优策略d*(aj),故选择最优攻击策略a*(θi),使自己的博弈收益期望Ua取最大值,即通过计算
a*(θi)∈max>a(aj,dh,θi)
精炼贝叶斯均衡求解
其中,攻击者包含n种攻击类型,θi为攻击者类型,1≤i≤n,攻击者可选择m种攻击策略,aj为攻击策略,1≤j≤m,防御者可选择k种攻击策略,dh为防御策略,1≤h≤k。
进一步的,步骤(5-1)具体为:根据以往攻击记录的特征属性形成攻击类型推理决策表。根据攻击记录中各证据的数值以及不同数值的组合下对应的攻击者类型不同,将其记录下来,形成决策表,证据使用ck表示,攻击类型使用θu1表示。
进一步的,步骤(5-2)具体为:
根据决策表确定该攻击策略中各证据的基本概率赋值(BPA)。防御者根据检测到攻击证据集中ck的值,将与ck值相同的历史记录从对应的U/{ck,θur}中划分出来,计作Bk,最后按照Bk中历史记录u对应的攻击类型不同,将Bk划分为Bk={{Bk1},{Bk2},...{Bkz}},那么ck对Bk中各类型的决策规则强度计算公式为:
ck对Bk中所有攻击类型的扩充决策规则强度计算公式为:
证据ck对应的各攻击类型的基本概率赋值为:
证据ck对所有攻击类型的基本概率赋值为:
进一步的,步骤(5-3)具体为:
k个证据ck,
进一步的,步骤(5-4)具体为:
对步骤(5-3)所得的组合后的BPA进行pignistic概率转换,得到攻击者的类型θi的后验概率。其中pignistic概率转换公式为:
本发明有益效果如下:
现有模型中防御者的先验概率通常根据经验或认为指定,主观性较强,由此,对防御者的后验概率及防御策略收益计算带来影响,从而导致防御系统在前期防御成功率下降。本文提出了一种基于D-S证据推理的不完全信息动态博弈模型,该模型在不完全信息动态博弈基础上,通过构建攻击类型决策表,并采用D-S证据推理的方法修正防御者对攻击类型的后验推断,使得概率更新更加客观,弥补了现有模型中先验概率的不足之处,使防御策略收益更加合理,提高了系统前期的防御成功率。
附图说明
图1是本发明所述方法的流程框图。
图2是本发明建立攻防博弈模型流程框图。
图3是本发明攻击者选择攻击策略流程框图。
图4是本发明所述攻防收益量化流程框图
图5是本发明所述防御策略决策的流程框图。
图6是本发明所述防御者修正攻击类型后验概率流程框图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
如图1所示,首先建立攻防博弈模型,定义模型内各个参数,随后在系统中攻击者发动攻击,防御者根据观察到的攻击策略,计算收益,通过精炼贝叶斯求解选择最优防御策略。
如图2所示为本发明建立攻防博弈模型流程框图。首先基于不完全信息动态博弈建立博弈模型,模型使用八元组
如图3所示为本发明攻击者选择攻击策略流程框图。引入“自然”参与人,首先“自然”选择攻击类型,攻击者观察到攻击类型并选择具体的攻击策略。
如图4所示为本发明所述攻防收益量化流程框图。防御者在观察到攻击策略后,防御者根据攻击策略计算后验概率,并计算此攻击策略下的防御策略风险收益,最终得到防御者收益。
如图5所示为本发明所述防御策略决策的流程框图。由上图得攻防收益后推断各自最优策略,最后由精炼贝叶斯均衡求解得出最优解。如图6所示为本发明所述防御者修正攻击类型后验概率,为下一步攻防做准备。
参照图1,一种基于博弈论的移动目标防御最优防御策略选取的方法,包括以下步骤:
步骤1.建立攻防博弈模型,参照图2;
1.1定义攻防博弈模型,基于不完全信息动态博弈建立博弈模型,模型使用八元组
1.2定义攻防收益量化,定义攻击成本AC;防御成本DC;系统损失代价SLC;综合以上定义可得攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi);
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh;
步骤2攻击者选择攻击策略,参照图3;
2.1“自然”按一定的概率从攻击者Na的类型空间Θn中选择一个类型θi,攻击者Na知道θi,防御者Nd不知道,但防御者Nd拥有对θi的推断,即防御者知道攻击类型的先验概率。
2.2攻击者Na在观察到θi后从其策略空间A中选择一条攻击策略aw
步骤3.防御者观察到攻击策略,攻防双方计算收益,参照图4;
3.1防御者根据观察到的攻击策略计算后验概率,根据贝叶斯法则计算后验概率
3.2攻防双方计算各自收益,攻击者收益计算公式为:
Ua(θi,aj,dh)=SLC(aj)+DC(dh,θi)-AC(aj,θi);
防御者收益计算公式为:
Ud(aj,dh,θi)=SLC(aj)+AC(aj,θi)-DCh;
通过攻防收益公式可计算出第一阶段的博弈树。
步骤4精炼贝叶斯均衡求解得出最优防御策略,参照图5
防御者推断最优防御策略d*(aj),即通过计算
攻击者推断最优攻击策略a*(θ),攻击者θ预见到防御者会观察到自己的攻击策略a的基础上,选择最优策略d*(a),故选择最优攻击策略a*(θ),使自己的博弈收益期望Ua取最大值,即通过计算
a*(θi)∈max>a(aj,dh,θi)
精炼贝叶斯均衡求解
步骤5防御者使用DS正推推理修正攻击类型后验概率,参照图6
5.1:根据以往攻击记录的特征属性形成攻击类型推理决策表。根据攻击记录中各证据的数值以及不同数值的组合下对应的攻击者类型不同,将其记录下来,形成决策表,证据使用ck表示,攻击类型使用θu1表示。
5.2根据决策表确定该攻击策略中各证据的基本概率赋值(BPA)。防御者根据检测到攻击证据集中ck的值,将与ck值相同的历史记录从对应的U/{ck,θur}中划分出来,计作Bk,最后按照Bk中历史记录u对应的攻击类型不同,将Bk划分为Bk={{Bk1},{Bk2},...{Bkz}},那么ck对Bk中各类型的决策规则强度计算公式为:
ck对Bk中所有攻击类型的扩充决策规则强度计算公式为:
证据ck对应的各攻击类型的基本概率赋值为:
证据ck对所有攻击类型的基本概率赋值为:
5.3:k个证据ck,
5.4:对步骤③所得的组合后的BPA进行pignistic概率转换,得到攻击者的类型θi的后验概率。其中pignistic概率转换公式为:
机译: 交通综合管理系统中基于DSRC的基于动态路由的最优路由提供方法
机译: 交通综合管理系统中基于DSRC的基于动态路由的最优路由提供方法
机译: 基于免疫策略的流量数据的方法和设备最优特征子集采集