法律状态公告日
法律状态信息
法律状态
2023-09-15
实质审查的生效 IPC(主分类):G06Q10/0639 专利申请号:2023106462111 申请日:20230602
实质审查的生效
2023-08-29
公开
发明专利申请公布
技术领域
本发明涉及进化博弈研究技术领域,尤其涉及基于遗传算法的连续动作迭代困境的复杂网络生成方法。
背景技术
近年来,各种决策模型之间的演化趋势和协同现象受到经济、工业、人工智能等诸多领域的广泛关注,其中演化博弈有效分析了个体的策略选择与所得收入之间复杂的动态演化关系。演化博弈论在工程优化、多智能体对抗等诸多应用领域引起了学者们的关注。目前演化博弈论的工作重点是演化博弈论中多重困境的动态性和稳定性,这有助于解决资源分配问题。然而,玩家之间复杂的互动也对收敛和收敛值产生了不可忽视的影响,而这在传统作品中往往被忽视。基于这些,本文研究了在连续动作迭代困境(CAID)中起关键作用的复杂网络。
在仿真实验过程中,我们发现有时在相同的参数设置下,CAID在不同复杂网络中的收敛值是不同的,并且有一些复杂网络中参与者的合作水平更好。因此,为了评价复杂网络的质量,本文提出了一种基于遗传算法的最优复杂网络生成方法。通过改变参与者之间的关系,我们提供了一种提高社会合作水平和减少社会收敛时间的可行途径。随着进化博弈论的发展,复杂网络在代表玩家复杂社会关系方面发挥着至关重要的作用。
在传统的进化博弈研究中,有许多与不变网络相关的指标。一些作者在一个简单的规则网络上对代理进行建模,在该网络上,外部强制机制控制着学习方法,或者有的作者研究了多路复用网络上的进化博弈,其中个体获得总收益,明确控制多路复用中不同层节点之间的度相关强度,还有其他作者开发了一种统计方法来解决变量选择问题,并采用套索回归方法来恢复网络结构,然而这些作品中的指标仅适用于特定情况,缺乏适用性,因此本发明提出基于遗传算法的连续动作迭代困境的复杂网络生成方法以解决现有技术中存在的问题。
发明内容
针对上述问题,本发明的目的在于提出基于遗传算法的连续动作迭代困境的复杂网络生成方法,该基于遗传算法的连续动作迭代困境的复杂网络生成方法具有通过遗传算法寻找最优关系,通过改变玩家之间的连接关系来提高合作水平,减少收敛时间的优点,解决现有技术中的问题。
为实现本发明的目的,本发明通过以下技术方案实现:基于遗传算法的连续动作迭代困境的复杂网络生成方法,包括以下步骤:
步骤一:根据对连续动作迭代困境的稳定性分析,以及遗传算法和动态模型的探究,提出社会合作评估标准以及社会关系评价机制;
步骤二:用社会合作评估标准对不同的复杂网络进行评估;
步骤三:利用社会关系评价机制找到针对连续动作迭代困境的复杂网络优化;
步骤四:设计出最优复杂网络生成方法;
步骤五:对连续演化动力学包括连续动作迭代困境与各种学习能力的收敛性分析。
进一步改进在于:所述步骤二中,评估的具体步骤为:
S1:结合连续动作迭代困境的特征因子,构建评价函数,其公式表达为:
f(G,m,F)=κ
S2:将影响特征因子的因素分为三个部分,分别为复杂网络G的图、CAID的收益矩阵m以及策略适应度F;
S3:定义图适应度函数,用公式表达为:
f(G)=κ
S4:根据不同复杂网络的在评价函数中的反映,利用社会合作评估标准选择相对较好的复杂网络使连续动作迭代困境性能达到更好。
进一步改进在于:所述步骤二中,特征因子包括收敛值和达到收敛值的时间。
进一步改进在于:所述步骤三中,复杂网络优化的具体步骤为:
SS1:输入策略、支付矩阵和图,进行策略适应度的计算,以及可能性相关的计算;
SS2:将SS1中得到的计算数据,代入社会关系评价机制,确定更新策略,同时计算全局误差对算式进行判断,其全局误差的公式表达为:
SS3:若存在
进一步改进在于:所述步骤四中,先采用适合于搜索最优复杂网络的编码方法对连续动作迭代困境进行编码,然后随机生成主要种群,再计算个体的图适应度,之后通过交叉和变异更新种群,优秀的个体进入下一代,而较差的个体被淘汰,最后输出种群中的最优个体。
进一步改进在于:所述步骤五中,收敛性分析具体步骤为:
AA1:先进行连续演化动力学的收敛性分析,将系统描述为:
其中L
AA2:提出两个引理,第一个引理是若图Gk是强连通的,那么它具有一个生成树并且Lk的秩为N-1,第二个引理是若L的秩为N-1,则1α是L的零空间中的唯一向量,并且对于某个常数α具有稳态x
AA3:根据两个引理得出α=0,并且根据e为statex与平衡点α之间的误差得到e的剥夺,同时还可得到e
AA4:证明等式中有李雅普诺夫函数的演化动力学模型是收敛的。
进一步改进在于:所述SS3中,若存在
进一步改进在于:所述步骤四中,种群更新机制为:
设置最大迭代次数为J,若迭代次数达到S,则输出种群中的最优个体。
本发明的有益效果为:该基于遗传算法的连续动作迭代困境的复杂网络生成方法通过改变参与者之间的关系,提高社会合作水平和减少社会收敛时间的可行途径,即提高合作水平并且减少社会收敛时间,同时本发明提出了一种新的社会合作评估标准,同时提出一种社会关系评估机制,借用遗传算法和几项创新以此来解决连续动作迭代困境的问题,同时针对复杂网络在博弈模型中的重要作用,本发明更加关注于演化博弈和演化动态模型的稳定性,同时还通过使用多个不连续的李雅普诺夫函数来分析复杂网络优化的全局稳定性,它克服了连续李雅普诺夫函数不能同时证明GA算法和进化博弈收敛的缺点。
附图说明
图1是本发明的流程示意图。
图2是本发明的最优网络生成过程示意图。
具体实施方式
为了加深对本发明的理解,下面将结合实施例对本发明做进一步详述,本实施例仅用于解释本发明,并不构成对本发明保护范围的限定。
根据图1-图2所示,本实施例提出了基于遗传算法的连续动作迭代困境的复杂网络生成方法,包括以下步骤:
步骤一:根据对连续动作迭代困境(CAID)的稳定性分析,以及遗传算法(GA算法)和动态模型的探究,提出社会合作评估标准以及社会关系评价机制;
步骤二:用社会合作评估标准对不同的复杂网络进行评估,评估的具体步骤为:
S1:结合连续动作迭代困境的特征因子,并综合考虑影响因素,构建评价函数,在传统演化博弈论的研究中,收敛值决定了所有参与者的合作水平,继而通过考虑CAID的两个特征因子,即特征因子包括收敛值和达到收敛值的时间,其公式表达为:
f(G,m,F)=κ
S2:将影响特征因子的因素分为三个部分,分别为复杂网络G的图、CAID的收益矩阵m以及策略适应度F;
S3:定义图适应度函数,用公式表达为:
f(G)=κ
S4:根据不同复杂网络的在评价函数中的反映,利用社会合作评估标准选择相对较好的复杂网络使连续动作迭代困境性能达到更好;
在每次迭代中,玩家i的全局误差可以通过:
计算,若E
步骤三:利用社会关系评价机制找到针对连续动作迭代困境的复杂网络优化,复杂网络优化的具体步骤为:
SS1:输入策略、支付矩阵和图,进行策略适应度的计算,以及可能性相关的计算;
SS2:将SS1中得到的计算数据,代入社会关系评价机制,确定更新策略,同时计算全局误差对算式进行判断,其全局误差的公式表达为:
SS3:若存在
步骤四:设计出最优复杂网络生成方法,先采用适合于搜索最优复杂网络的编码方法对连续动作迭代困境进行编码,然后随机生成主要种群,再计算个体的图适应度,之后通过交叉和变异更新种群,优秀的个体进入下一代,而较差的个体被淘汰,最后输出种群中的最优个体,具体的包括以下步骤:
A1:根据群体中每个个体代表的复杂CAID网络按照给定算法进行编码,群体中每个玩家都有编号,若两个玩家在一个个体中彼此相邻,则代表它们具有连接关系;
A2:通过编码和解码方案随机生成由χ个个体组成的初级种群,产生的每个个体根据步骤二中提供的计算方法计算具体个体的图适应度;
A3:在交叉操作中,进化种群,按照单点交叉的方法进行操作,如果随机数小于Pc,则随机选择种群中的其他个体与原个体杂交,否则,当前个体执行下一个操作;
在变异操作中,如果随机数小于Pm,则个体进行单点变异,否则,当前个体执行下一个操作;
由于自然界中变异的发生频率低于交叉,因此Pc通常大于Pm,继而计算新个体的图适应度,如果比当前个体更好,则新个体进入下一次进化并丢弃当前个体,否则,保留当前个体;
A4:重复种群更新机制,设置最大迭代次数为J,若迭代次数达到S,则输出种群中的最优个体,根据解码机制,得到CAID的最优复杂网络;
步骤五:对连续演化动力学包括连续动作迭代困境与各种学习能力的收敛性分析,收敛性分析具体步骤为:
AA1:先进行连续演化动力学的收敛性分析,将系统描述为:
其中L
AA2:提出两个引理,第一个引理是若图Gk是强连通的,那么它具有一个生成树并且Lk的秩为N-1,第二个引理是若L的秩为N-1,则1α是L的零空间中的唯一向量,并且对于某个常数α具有稳态x
AA3:根据两个引理得出α=0,并且根据e为statex与平衡点α之间的误差得到e的剥夺,同时还可得到e
AA4:证明等式中有李雅普诺夫函数的演化动力学模型是收敛的,则将李雅普诺夫函数设置为:
通过对V式子的求导分析可以得到:
建立:
φmax=max(φ
可以计算出:
因此可以证明出CAID的进化动态模型是收敛的。
在本实施例中,本发明主要包括新的社会合作评价标准来衡量CAID中参与者之间社会关系的质量,以及社会关系评价机制提高合作水平和减少社会收敛时间,通过结合所发明的社会合作评价标准以及社会关系评价机制来实现连续动作迭代困境的复杂网络优化。
本发明可以应用在社会基础建设工程上,利用社会关系评估机制在演化博弈动力下进行模拟,并通过对相关参数的计算以及其收敛性的分析,进而提高工程项目的合理性与稳定性。在相关工程项目中,由于在过去的博弈模型中并未考虑参与方之间复杂的互动也对收敛和收敛值产生了影响,可能导致工程的可靠性与稳定性降低。通过该项最优复杂网络生成方法,可以很好的提高社会合作水平和减少社会收敛时间,使工程项目高效合理的完成。
例如,在社会基础建设工程中,该最优复杂网络生成算法可以应用于工程建设的材料使用,成本控制,智能化操作等方面。
利用演化动力学模型以及复杂网络生成方法,可以很好的进行数据处理和模拟分析,使得工程系统可以根据实施情况及时有效地调整建设方式以及策略,从而提高资源利用率以及时间成本。
除此之外,该演化模型还可以应用于人工智能方面,通过参与方(玩家)之间复杂的互动也对收敛和收敛值产生的影响,使用最优复杂网络生成方法不断优化人工智能算法及其模型,让人工智能与社会生活生产产生更加紧密联系。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
机译: 基于将状态分配给动作的对应信息的程序生成程序,程序生成装置以及程序生成方法,以及用于生成对应信息的程序,装置以及方法
机译: 基于投资组合生成的快速遗传算法的系统和方法
机译: 基于快速遗传算法的产品组合生成的系统和方法