法律状态公告日
法律状态信息
法律状态
2020-08-25
授权
授权
2019-01-01
实质审查的生效 IPC(主分类):G06F11/36 申请日:20180614
实质审查的生效
2018-12-07
公开
公开
技术领域
本发明提出了一种基于复杂网络的集群系统弹性测评方法,它涉及一种基于复杂网络的集群系统弹性测评方法,属于复杂性科学领域以及可靠性领域。
背景技术
随着“中国制造2025”的提出,嵌入式技术、分布式计算、移动通信、智能控制等各类工程技术的蓬勃发展和广泛应用,计算机网络系统、工程控制系统、物联网平台等系统和平台朝着物理层与信息层相融合的智能化方向发展,形成具有复杂性、异构性、深度融合、自组织、自适应等多种复杂特性的智能系统。集群系统为智能系统中一种具有代表性的系统,相比于普通的线性系统,其具有系统功能交互涌现、系统结构动态演化、内外状态深度感知、网络实时适时控制等优势,可以应用于机器人控制、智能制造等方面。
系统的弹性最初用于衡量可持续性,即一个系统的受到扰动后恢复原状的能力,该指标最早应用于生态学领域,用于描述生态系统受到扰动后通过自我修复和反馈调节恢复原状的能力,其概念逐渐应用于系统工程、组织管理等领域。现阶段“弹性”被定义为一种衡量系统应对扰动的能力,包括扰动时吸收扰动以及扰动后系统恢复的能力,扰动可以包括系统内部的故障以及来自系统外部的干扰。针对衡量弹性的指标,现阶段没有一个统一的定义,现有研究主要围绕系统扰动发生时的抗扰能力以及扰动发生后的恢复能力进行测评。现有的弹性指标主要从系统受到扰动后,系统整体的性能函数的降级以及恢复过程进行评判,对于系统内部各节点的演化过程考虑较少。
集群系统相比简单系统而言,由于其功能复杂以及各节点之间的网络拓扑结构复杂,导致集群系统故障规律以及演化规律相对复杂,故障的形式也多种多样。为了使系统具备在复杂工作环境下仍能正常运行的能力,集群系统的弹性性能需要有所提升。但由于集群系统的特性使得如何度量集群系统的弹性成为现阶段的一个难题。
本发明针对于以上的问题及趋势提出了一种有效的解决方案。本方案主要将复杂网络的相关概念引入集群系统的弹性性能测评中来,采用复杂网络中“最大连通子团”这一指标作为集群系统的弹性指标,通过获取故障注入后集群系统的“最大连通子团”规模的变化趋势来衡量系统的弹性性能。本发明采用的基于复杂网络的动态测量的方案,解决了现有的弹性测量方法对于集群系统这种复杂结构系统度量效果差的问题。
发明内容
本发明主要应用于提供一种集群系统的弹性度量以及测评方法。由于集群系统具有复杂性、异构性、深度融合、自组织、自适应等多种复杂特性,其系统结构相对简单系统要复杂,现有的弹性指标主要围绕系统扰动发生时的抗扰能力以及扰动发生后的恢复能力进行测评,对于如集群系统这类内部耦合结构复杂、系统内部节点众多的复杂系统现有的弹性测评方法无法很好的体现系统在受到扰动后弹性的演化特征。于是我们构建出一种可以有效的体现集群系统的弹性性能的测评方法。
针对以上的技术问题以及本发明的目的,本文提出了一种基于复杂网络的集群系统弹性测评方法,方案包括如下部分:
(一)发明目的
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于复杂网络的集群系统弹性测评方法,在考虑到集群系统复杂性、异构性、深度融合、自组织、自适应等多种复杂特性的前提下,采用本发明提出的弹性测评方法对集群系统受到扰动后弹性的演化特征进行评测,从而更加清晰的刻画集群系统的弹性性能,便于系统设计人员了解系统的性能,并根据需求对系统进行改进,进而提高系统的弹性性能。
(二)技术方案
为了实现上述目的,本发明的方法所采用的技术方案是:一种基于复杂网络的集群系统弹性测评方法。
本发明一种基于复杂网络的集群系统弹性测评方法,其步骤如下:
步骤A:分析测评对象构建系统网络模型;
步骤B:根据测评对象设定弹性指标;
步骤C:根据测评对象确定扰动参数;
步骤D:实施扰动,监控记录系统性能指标;
步骤E:汇总性能指标的变化趋势,分析集群系统的弹性性能;
其中,步骤A中所述的“分析测评对象构建系统网络模型”,其具体含义为:通过对测评对象进行分析,发掘其各个节点之间的硬件拓扑结构以及各个节点之间的调用关系,进而构建系统的网络模型,为接下来分析系统的弹性性能做准备;包括以下步骤:
步骤A1:分析抽取集群系统的节点分布情况,构建系统网络模型的点集V;
步骤A2:分析抽取各个节点之间的调用关系,构建系统网络模型的边集E;
步骤A3:构建系统网络模型G;
其中,步骤A中所述的“系统网络模型”,为一个具体的集群系统可以抽象为一个点集V和一个边集E组成的图G,即:G=(V,E);抽象后的网络模型可以清晰体现各个节点之间的调用关系,并方便对系统进行弹性性能分析;根据系统的调用关系的不同,该图可以为有向图或无向图,图的存储形式可以为矩阵或者链表的形式;
其中,步骤B中所述的“根据测评对象设定弹性指标”,其具体含义为:根据所需测量的集群系统的性能,设置接下来进行的弹性指标;包括以下步骤:
步骤B1:确定所需分析的系统性能类型;
步骤B2:量化所需分析的性能参数;
步骤B3:构建系统的弹性指标;
其中,步骤B1中所述的“确定所需分析的系统性能类型”,其具体做法如下:根据测试的具体要求,确定所要分析的系统性能类型;由于评判一个系统的性能有很多个维度,各个维度的评判标准与评判方法各不相同,故在对系统建立弹性指标之前需要根据测试要求确定所要分析系统的性能类型;以集群机器人系统为例,可以对集群物流机器人系统的各个子机器人之间的通讯能力、子机器人之间传感器感知能力等多维度进行弹性测试;
其中,步骤B2中所述的“量化所需分析的性能参数”,其具体做法如下:根据性能类型的特点,量化性能参数;在确立好性能类型的前提下,根据性能类型的特点,得到能够正确表达该系统状态的性能参数,为构建系统弹性的测评指数建立基础;
其中,步骤B3所述的“构建系统的弹性指标”,其具体做法如下:运用复杂网络中的最大连通子团的概念构建系统的弹性指标,包括以下的步骤:
步骤B31:计算初始状态下的系统网络模型的最大连通子团的规模;
步骤B32:以初始状态下的最大连通子团作为基础,构建弹性测评指数;
其中,步骤B31中所述的“系统网络模型的最大连通子团的规模”,其具体内容如下:最大连通子团G′是指在系统网络模型内最大的一个连通子团;连通子团,又称连通子图,是指在系统网络模型G中的一个子团,在这个子团内的任意两个节点至少存在一条简单路径,即两个节点之间可以连通,而最大连通子团G′是指在非连通图内最大的一个连通子团,
其中,步骤B31中所述的“计算初始状态下的系统网络模型的最大连通子团的规模”,其具体作法如下:使用广度优先搜索(BFS)对初始状态下的集群系统网络模型求解最大连通子团的规模;广度优先搜索又叫横向优先搜索,其基本原理为:从根节点开始进行搜索,沿着树的宽度遍历树的节点,当所有的节点均被访问,则该方法终止;在系统网络模型G中,随机寻找一个特定的源节点s,然后广度优先搜索系统地探索G中的边,最终发现可以从s到达的所有节点,即为包含源节点的一个连通子团,将该连通子团的节点信息进行存贮,接着从未被记录的节点中随机寻找一个节点作为源节点s′并执行广度优先搜索连通子团程序,直至遍历所有节点,将所储存的所有连通子团规模信息进行比较,这样就可以找到最大连通子团;该方法对有向图和无向图同样适用;
其中,步骤B32中所述的“以初始状态下的最大连通子团作为基础,构建弹性测评指数”,其具体作法如下:以集群系统网络模型初始状态下的最大连通子团G0′作为为依据,集群系统当受到扰动后,最大连通子团的规模势必发生变化,而最大连通子团的规模可以衡量集群系统网络是否稳定,故在本专利中,弹性测评指数R可由t1时刻的弹性最大连通子团的规模
其中,步骤C中所述的“根据测评对象确定扰动参数”,其具体作法如下:根据实际使用情况下,集群系统所需承载的最大扰动,设置对集群系统注入的压力或者故障的指标,如:对集群系统的通讯抗压的弹性性能进行测试时,根据实际需求设置注入时最大通讯压力Pmax、被注入节点占所有节点的比例以及注入时长Pt。
其中,步骤D中所述的“实施扰动,监控记录系统弹性指标”,其具体作法如下:根据步骤C所确定的扰动参数对系统进行压力注入,通过软件监控或者硬件监控的方式监控每个节点在故障注入前、故障注入中以及故障注入后三个阶段性能降级、性能恢复的参数,根据步骤B2所量化的性能参数,判断节点间是否发生故障,并将性能参数以及判断后的故障信息进行记录,以供下一步进行分析;
其中,步骤E中所述的“汇总性能指标的变化趋势”,其具体作法如下:提取每个节点在步骤D所记录的性能指标以及故障信息,按照时间顺序进行汇总,最终汇总出在时间序列t下集群网络模型的边集Et,边集Et与点集V可组成一组在时间序列t下集群网络模型集合Gt,即:Gt=(V,Et);
其中,步骤E中所述的“分析集群系统的弹性性能”,其具体作法如下:对在时间序列t下集群网络模型集合Gt中每个图Gt依据步骤B3进行分析可以得出一组时间序列t下的弹性指标,这组弹性指标的变化趋势可以体现在压力下注入后系统的弹性性能。
通过以上步骤,本方法提出了一种基于复杂网络的集群系统弹性测评方法,解决了现有的弹性指标主要围绕系统扰动发生时的抗扰能力以及扰动发生后的恢复能力进行测评,对于如集群系统这类内部耦合结构复杂、系统内部节点众多的复杂系统现有的弹性测评方法无法很好的体现系统在受到扰动后弹性的演化特征。具有良好的实际应用价值。
(三)优点创新
本发明具有如下的创新点:
1.易计算:本发明中所采用的弹性指标基于最大连通子团这一概念,可以采用广度优先搜索算法进行求取,广度优先搜索算法相比其他复杂算法容易实现,且对系统的硬件要求较低,便于工程操作;
2.易移植:本发明所设计的计算弹性测评方法适用于多类集群系统,具有通用性的特性,对测评多种集群系统时,方便对测试程序进行移植,增强工程操作中的便利性;
3.更真实:采用基于复杂网络来描述集群系统的网络模型结构,可以更好地体现集群系统的连通性,更加真实,贴合实际情况。
综上,这种基于复杂网络的集群系统弹性测评方法为工程应用中的集群系统弹性测试提供一种很好的解决方案。
附图说明
图1是本发明所述方法流程图。
具体实施方式
为使本发明要解决的技术问题、技术方案更加清楚,下面将结合附图及具体实施案例进行详细描述。应当理解,此处所描述的实施实例仅用于说明和解释本发明,并不用于限定本发明。
本发明的目的在于解决现有的弹性指标主要围绕系统扰动发生时的抗扰能力以及扰动发生后的恢复能力进行测评,对于如集群系统这类内部耦合结构复杂、系统内部节点众多的复杂系统现有的弹性指标和测评方法无法很好的体现系统在受到扰动后弹性的演化特征。具有良好的实际应用价值
下面结合附图说明及具体实施方式对本发明进一步说明。
本发明实施例以某智能集群机器人系统为例,阐述本发明方法。具体地说,该分拣中心包含200个机器人,机器人间通过ZigBee模块进行通信,现需要对该系统的系统内部信息传递的弹性性能进行测试。
为了实现上述目的,本发明的方法所采用的技术方案是:一种基于复杂网络的集群系统弹性测评方法。其流程如图1所示:
步骤A:分析测评对象构建系统网络模型;
为整个方法的基础,通过对测评对象进行分析,发掘其各个节点之间的硬件拓扑结构以及各个节点之间的调用关系,进而构建系统的网络模型,为接下来分析系统的弹性性能做准备。分析抽取集群系统的节点分布情况,构建系统网络模型的点集V,分析抽取各个节点之间的调用关系,构建系统网络模型的边集E,构建系统网络模型G。
步骤B:根据测评对象设定弹性指标;
构建了集群系统的弹性指标,为接下来的弹性测评具体实施提供依据。根据测试的具体要求,确定所要分析的系统性能类型。根据性能类型的特点,量化性能参数。运用复杂网络中的最大连通子团的概念构建系统的弹性指标,首先计算初始状态下的系统网络模型的最大连通子团的规模,接着以初始状态下的最大连通子团作为基础,构建弹性测评指数。
步骤C:根据测评对象确定扰动参数;
根据实际使用情况下,集群系统所需承载的最大扰动,设置对集群系统注入的压力或者故障的指标,如:对集群系统的通讯抗压的弹性性能进行测试时,根据实际需求设置注入时最大通讯压力Pmax、被注入节点占所有节点的比例以及注入时长Pt。
步骤D:实施扰动,监控记录系统性能指标;
根据步骤C所确定的扰动参数对系统进行压力注入,通过软件监控或者硬件监控的方式监控每个节点在故障注入前、故障注入中以及故障注入后三个阶段性能降级、性能恢复的参数,根据步骤B2所量化的性能参数,判断节点间是否发生故障,并将性能参数以及判断后的故障信息进行记录,以供下一步进行分析。
步骤E:汇总性能指标的变化趋势,分析集群系统的弹性性能。
对在时间序列t下集群网络模型集合Gt中每个图Gt依据步骤B3进行分析可以得出一组时间序列t下的弹性指标,这组弹性指标的变化趋势可以体现在压力下注入后系统的弹性性能。
其中,步骤A中所述的“分析测评对象构建系统网络模型”,其具体含义为:通过对测评对象进行分析,发掘其各个节点之间的硬件拓扑结构以及各个节点之间的调用关系,进而构建系统的网络模型,为接下来分析系统的弹性性能做准备;包括以下步骤:
步骤A1:分析抽取集群系统的节点分布情况,构建系统网络模型的点集V;
步骤A2:分析抽取各个节点之间的调用关系,构建系统网络模型的边集E;
步骤A3:构建系统网络模型G;
其中,步骤A中所述的“系统网络模型”,为一个具体的集群系统可以抽象为一个点集V和一个边集E组成的图G,即:G=(V,E);抽象后的网络模型可以清晰体现各个节点之间的调用关系,并方便对系统进行弹性性能分析;根据系统的调用关系的不同,该图可以为有向图或无向图,图的存储形式可以为矩阵或者链表的形式;
其中,步骤B中所述的“根据测评对象设定弹性指标”,其具体含义为:根据所需测量的集群系统的性能,设置接下来进行的弹性指标;包括以下步骤:
步骤B1:确定所需分析的系统性能类型;
步骤B2:量化所需分析的性能参数;
步骤B3:构建系统的弹性指标;
其中,步骤B1中所述的“确定所需分析的系统性能类型”,其具体做法如下:根据测试的具体要求,确定所要分析的系统性能类型;由于评判一个系统的性能有很多个维度,各个维度的评判标准与评判方法各不相同,故在对系统建立弹性指标之前需要根据测试要求确定所要分析系统的性能类型;以集群机器人系统为例,可以对集群物流机器人系统的各个子机器人之间的通讯能力、子机器人之间传感器感知能力等多维度进行弹性测试;
其中,步骤B2中所述的“量化所需分析的性能参数”,其具体做法如下:根据性能类型的特点,量化性能参数。在确立好性能类型的前提下,根据性能类型的特点,得到能够正确表达该系统状态的性能参数,为构建系统弹性的测评指数建立基础;以集群机器人系统的机器人之间的通讯能力为例,设其通讯正常时某两个机器人之间的丢包率为pk,当受到电磁干扰后,丢包率增加。当丢包率增长为正常的α倍后,即pk1=αpk,认为发生故障,某两个机器人之间通讯中断,此时系统网络模型中这两个机器人对应的节点之间的连边被打断;
其中,步骤B3所述的“构建系统的弹性指标”,其具体做法如下:运用复杂网络中的最大连通子团的概念构建系统的弹性指标,包括以下的步骤:
步骤B31:计算初始状态下的系统网络模型的最大连通子团的规模;
步骤B32:以初始状态下的最大连通子团作为基础,构建弹性测评指数;
其中,步骤B31中所述的“系统网络模型的最大连通子团的规模”,其具体内容如下:最大连通子团G′是指在系统网络模型内最大的一个连通子团;连通子团,又称连通子图,是指在系统网络模型G中的一个子团,在这个子团内的任意两个节点至少存在一条简单路径,即两个节点之间可以连通,而最大连通子团G′是指在非连通图内最大的一个连通子团,
其中,步骤B31中所述的“计算”,其具体方法如下:使用广度优先搜索(BFS)对初始状态下的集群系统网络模型求解最大连通子团的规模;广度优先搜索又叫横向优先搜索,其基本原理为:从根节点开始进行搜索,沿着树的宽度遍历树的节点,当所有的节点均被访问,则算法终止;在系统网络模型G中,随机寻找一个特定的源节点s,然后广度优先搜索系统地探索G中的边,最终发现可以从s到达的所有节点,即为包含源节点的一个连通子团,将该连通子团的节点信息进行存贮,接着从未被记录的节点中随机寻找一个节点作为源节点s′并执行广度优先搜索连通子团程序,直至遍历所有节点,将所储存的所有连通子团规模信息进行比较,这样就可以找到最大连通子团。该算法对有向图和无向图同样适用;
其中,步骤B32中所述的“构建弹性测评指数”,其具体方法如下:以集群系统网络模型初始状态下的最大连通子团G0′作为为依据,集群系统当受到扰动后,最大连通子团的规模势必发生变化,而最大连通子团的规模可以衡量集群系统网络是否稳定,故在本专利中,弹性测评指数R可由t1时刻的弹性最大连通子团的规模
其中,步骤C中所述的“根据测评对象确定扰动参数”,其具体方法如下:根据实际使用情况下,集群系统所需承载的最大扰动,设置对集群系统注入的压力或者故障的指标,如:对集群系统的通讯抗压的弹性性能进行测试时,根据实际需求设置注入时最大通讯压力Pmax、被注入节点占所有节点的比例以及注入时长Pt。
其中,步骤D中所述的“实施扰动,监控记录系统弹性指标”,其具体方法如下:根据步骤C所确定的扰动参数对系统进行压力注入,通过软件监控或者硬件监控的方式监控每个节点在故障注入前、故障注入中以及故障注入后三个阶段性能降级、性能恢复的参数,根据步骤B2所量化的性能参数,判断节点间是否发生故障,并将性能参数以及判断后的故障信息进行记录,以供下一步进行分析;
其中,步骤E中所述的“汇总性能指标的变化趋势”,其具体方法如下:提取每个节点在步骤D所记录的性能指标以及故障信息,按照时间顺序进行汇总,最终汇总出在时间序列t下集群网络模型的边集Et,边集Et与点集V可组成一组在时间序列t下集群网络模型集合Gt,即:Gt=(V,Et);
其中,步骤E中所述的“分析集群系统的弹性性能”,其具体方法如下:对在时间序列t下集群网络模型集合Gt中每个图Gt依据步骤B3进行分析可以得出一组时间序列t下的弹性指标,这组弹性指标的变化趋势可以体现在压力下注入后系统的弹性性能。
本发明未详细阐述部分属于本领域公知技术。
以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
机译: 有效构建云上虚拟集群的弹性虚拟集群管理方法,弹性虚拟集群管理装置和使用该集群的云系统
机译: 服务器集群中包含多个节点的集群中基于集群分散存储系统的最小带宽恢复编码方法AMD服务器通信中包含集群中的点的冗余且集群中存储的集群的冗余度系统
机译: 一种用于在整个电子设备的集群中分配电能的系统,一种用于在这样的系统的电子设备的集群之间分配电能的方法以及在这种系统中使用的控制单元