最优反应动态演化博弈模型的网络防御策略选取方法技术
本发明专利技术属于计算机网络安全防御技术领域。最优反应动态演化博弈模型涉及的网络防御策略的具体方法包括:基于有限理性条件,采用最优反应动态学习机制动态攻防演化博弈模型;利用防御策略选择动态演化过程和防御平衡点,研究不同防御之间防御策略的选择;在此基础上建立最优反应动态演化博弈模型,通过具体实例对模型进行分析和求解,并推广演化博弈模型。本发明专利技术建立了有限理性条件下的攻防演化博弈模型。通过布置防御策略的初始状态kaiyun全站网页版登录,经过不断的演化,最优的反应动力学最终会使博弈系统达到一定的稳定状态,从而得到最优的防御策略,本发明的专利技术提出的方法本发明能够很好地应用于网络安全防御策略的选择,对网络安全研究具有一定的指导意义。
所有详细技术资料下载
【技术实现步骤摘要】
最优反应动态演化博弈模型网络防御策略选择方法
本专利技术属于计算机网络安全防御
,具体涉及一种最优反应动态演化博弈模型的网络防御策略选择方法。
技术介绍
近年来,互联网的快速发展给人们的社会生活带来了巨大的变化,特别是“互联网+”战略将互联网的发展推向了新的高潮。随着互联网的快速发展,网络空间的安全问题日益突出。网络安全问题已经非常严重。针对国内外各类网络攻击,如何加强网络安全防御已成为当今时代需要解决的问题。迫切需要对网络攻防行为进行分析和预测,进而实施新的主动安全防御新措施。技术。因为网络安全状况本质上是由攻防双方的对策和结果决定的,而网络攻防对抗的目标对立性、策略性、非协调性是博弈论的基本特征。因此网络安全领域的研究和应用逐渐兴起,网络安全行为的分析都是基于经典传统博弈模型的运用。然而,大多数研究成果都是基于传统博弈论,建立在参与者完全理性假设的前提下,而这样的假设与实际情况并不相符。其博弈模型与现实存在较大偏差,降低了安全防御策略选择方法的准确性和指导意义。针对上述问题,有学者以有限理性为前提,采用演化博弈论的分析方法进行网络攻防分析。通过分析,演化博弈更符合网络攻防对抗动态演化的现实,将攻防双方的行为模型转化为具有一定自适应学习能力的渐进演化过程。动态方程的典型副本用于求解和分析。但动态学习机制存在学习速度慢、策略选择效率低等问题。
技术实施
就现有研究成果而言,本专利技术是基于传统博弈论,以参与者完全理性为前提的。这种假设与实际情况不符。据分析,会出现学习周期过长、学习效率低的问题,会很大程度上降低模型和方法的适用性,提出一种最优反应动态演化博弈模型的网络防御策略方法。本专利技术的技术方案为:一种最优反应动态演化博弈模型的网络防御策略选择方法,包括以下步骤: 步骤一:基于有限理性条件,采用最优反应动态学习机制进行战斗和防御演化游戏模型;步骤2:利用防御策略选择动态演化过程和防御演化平衡点,研究不同防御之间防御策略的选择;在此基础上通过具体实例对该模型进行分析和求解,并推广进化博弈模型。最优反应动态演化博弈模型的选择方法最优反应动态演化博弈模型可以表示为步骤1中的四元组,BRDEGM = (D, DS, P, U) d = { D1, d2, ... dn}代表防御参与者的空间。其中,DI表示防守I,不同防守者可以选择不同的防守策略; DS = {DS1, DS2, ... DSM}表示防御策略空间,不同部分的防御者与防御策略集共享; P = {P1, P2,… PM} 表示防守队员的信念集合。其中,PI表示防御策略DSI防御的概率;功能集,其中UI表示防御策略DSI的防御所获得的收益。
最优反应动态演化博弈模型网络防御策略的选择方法,即最优反应动态方程的个数为NT选择的DS1个数,表示NT防御策略。最优反应动态演化博弈模型的网络防御策略的选择方法是步骤2中的动态演化过程:在网络攻防对抗过程中,不同防御策略之间存在竞争关系。收入防御策略将消除较低收入策略。最优反应动态演化博弈模型的网络防御策略选择方法将用收益较低的策略淘汰高收益的防御策略。 A的好处是U1和U2之间的差异。最优反应动态演化博弈模型的选择方法。步骤3中,主要是进化博弈模型的推广。当防御方存在任意N种防御时,最优反应动态演化博弈模型为任意两种防御策略DSI和DSJ演化博弈分析。假设DSI相对于DSJ是一种有利策略,且I≠j,随着时间的推移,最终得到一定的演化规律。最优反应动态演化博弈模型的最优反应动态演化博弈模型的选择方法为:对于N次防御的防御方,当初始博弈中所有防御方都选择防御策略DSI或策略DSJ时,使用最优反应动态学习机制,全网防御方的策略选择最终稳定状态,供所有防御方选择策略DSI或策略DSJ。
最优反应动态演化博弈模型的最优反应动态演化博弈模型的选择方法为:对于N个防守者的防守方,当N为奇数时,在初始博弈中,只要有一个防守者被选中策略DSI通过最优反应动态学习机制反复调整自身策略,最终会收敛到所有防御的稳定状态来选择策略DSI。最优反应动态演化博弈模型的最优反应动态演化博弈模型的选择方法为:对于N名防守者的防守方,当N为偶然数时,在第一场比赛中,防守者选择了选择防守策略DSI ,其他防守方选择 DSJ 策略,则最优反应动力学无法使所有防守方收敛于稳定状态。随着时间的推移,策略的调整只能陷入一个循环周期的变化。最优反应动态演化博弈模型的最优反应动态演化博弈模型的选择方法为:对于N个防守者的防守方,在初始博弈中,只要有两个相邻的防守者同时选择了策略kaiyun.ccm,策略也同时选定。 DSI在最优响应动态学习机制下,最终会收敛到所有防御者随着时间的推移选择策略DSI的稳定状态。该专利技术的有益效果在于,该专利技术建立了有限理性条件下非合作网络攻防演化的博弈模型,并对模型进行了均衡分析和求解。在此基础上,从防守的角度出发,利用最优反应动态学习机制进行不同防守之间的策略学习调整过程,建立防守之间的多阶段动态演化博弈模型。对防御策略的选择进行了研究。
在建立最优反应动态演化博弈模型的基础上,通过具体算例对模型进行分析求解,并对模型进行进一步推广,提高模型的通用性。与防守的统一不同,防守策略初始状态的选择,会影响整个游戏系统的最终演化。通过安排防御策略的初始状态,经过不断的演化,最优的反应动力学最终将使博弈系统达到某一状态,从而获得最优的防御策略。表明该专利技术提出的方法可以很好地应用于网络安全防御策略的选择,可以为网络安全研究提供一定的指导意义。附图说明图1本专利技术的方法的方法框架示意图;图2 网络防御玩家博弈树示意图;图3 第一局比赛1 DS1最佳响应动态示意图;图4 DS1首局最佳反应动态策略调整过程图;图5 第一局比赛三台DS1的最佳反应动态策略调整过程;图6 当n为奇数时,初始状态只有一个DS1模拟效果图;邻防选用DS1模拟效果图。具体实现方法示例1,结合图1-图7,一种最优反应动态演化博弈模型的网络防御策略选择方法,包括以下步骤: 步骤一:基于有限理性条件,采用最优反应动态学习机制,并采用最优反应动态学习机制。构建基于最优反应动力学的博弈模型;步骤1中的最优反应动态演化博弈模型可以表示为四元群,BRDEGM = (D, DS, P, U) d = {d1, d2, dn} 表示防御参与者的空间。其中,DI表示防御I,不同的防御可以选择不同的防御策略; DS = {DS1, DS2, ... DSM} 表示防御策略空间。不同防守者共同分享防守策略收藏; P = {P1, P2, ... PM}表示防御信念的集合开yun体育app官网网页登录入口,其中PI表示防御策略DSI防御的概率; U = {U1, U2, ... UM}
【技术保护点】
一种最优反应动态演化博弈模型的网络防御策略选择方法,其特征在于:包括以下步骤: 步骤一:基于有限理性条件,利用最优反应动态学习机制构建基于最优反应动态和动态的博弈进化游戏。模型;步骤2:利用防御策略选择防御演化的动态演化过程和平衡点,研究不同防御之间防御策略的选择;步骤3:在建立最优反应动态演化博弈模型的基础上,通过建立最优反应动态演化博弈模型,通过建立博弈模型的具体实例对模型进行分析和求解,推进演化博弈模型。
【技术特点摘要】
1、一种最优反应动态演化博弈模型的网络防御策略选择方法,其特征在于:包括以下步骤: 步骤一:基于有限理性条件,利用最优反应动态学习机制构建攻防策略基于最优反应动态动态动力学。进化博弈模型;步骤2:利用防御策略选择动态演化过程和防御演化平衡点,研究不同防御之间防御策略的选择;通过具体算例对模型进行了分析和求解,推广了演化博弈模型。 2.根据权利要求1所述的最优反应动态演化博弈模型的网络防御策略选择方法,其特征在于:步骤1中的最优反应动态演化博弈模型可以表示为四元组,BRDEGM = ( DD (D D. , DS, P, U) d = {d1, d2, ... dn} 表示防御参与者的空间,其中 DI 表示防御者,不同的防御者可以选择不同的防御策略; DS1, DS2,...DSM}表示防御的策略空间,不同防御者共同共享防御策略集合;P = {P1,P2,...PM}表示防御信念集合{U1,U2, …UM}表示收益函数的集合,其中,UI表示防御者选择防御策略DSI所获得的收益。 3、根据权利要求所述的最优反应动态演化博弈模型选择方法。 1特点是:最佳响应动态式中NT的个数代表N个防御中选择的DS1的个数。 DS1 是由可选策略集中的任何防御策略。 4.根据权利要求1所述的最优反应动态演化博弈的最优反应动态演化博弈模型选择方法,其特征在于:所述步骤2中的动态演化过程为:在网络攻防对抗过程中,不同的防御不同的防御过程、不同的防御策略之间存在竞争关系,高收益的防御策略会淘汰收益较低的策略。 5.根据权利要求4所述的最优反应动态演化博弈模型的网络防御策略选择方法,其特征在于:高收益的防御策略将淘汰低收益的策略。 ,U1和U2分别是策略DS1和DS2的收益,A是U1...
【专利技术性能】
技术研发人员:张恒伟、王进东、黄建明、韩继红、何志红、李福林、王恒军、张昌、
申请(专利权):中国人民解放军信息工程大学、
类型:发明
国有省市: 河南 41
所有详细技术资料下载 我是该专利的所有者