首页> 中国专利> 业务系统可用性评估方法及系统

业务系统可用性评估方法及系统

摘要

本发明提供业务系统可用性评估方法及系统。该业务系统可用性评估方法包括:监测业务系统中网元故障事件,根据预设规则获取网元的健康分值,所述网元包括节点和链路;据节点在业务系统路径中出现的次数获取节点的权重;根据链路关联节点获取链路的权重;根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性。本发明的业务系统可用性评估方法及系统能够实现业务系统可用性的有效、准确评估。

著录项

  • 公开/公告号CN102123052A

    专利类型发明专利

  • 公开/公告日2011-07-13

    原文格式PDF

  • 申请/专利权人 北京星网锐捷网络技术有限公司;

    申请/专利号CN201110078197.7

  • 发明设计人 宋立华;

    申请日2011-03-30

  • 分类号H04L12/24(20060101);H04L12/26(20060101);

  • 代理机构11205 北京同立钧成知识产权代理有限公司;

  • 代理人马爽

  • 地址 100036 北京市海淀区复兴路33号翠微大厦东1106

  • 入库时间 2023-12-18 03:00:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-05-29

    授权

    授权

  • 2011-08-24

    实质审查的生效 IPC(主分类):H04L12/24 申请日:20110330

    实质审查的生效

  • 2011-07-13

    公开

    公开

说明书

技术领域

本发明涉及通信技术领域,尤其涉及业务系统可用性评估方法及系统。

背景技术

随着信息技术的反展,基于计算机软件技术构建的业务系统在社会经济运行中的重要性越来越高,特别是在金融、通信、医疗和政务等行业。例如银行的业务系统故障,储蓄和贷款等最基本的金融业务将无法展开;证券业务系统故障,每天数百亿的股票和基金交易将无法进行;医疗业务系统故障,医生将无法查阅病人的历史病例和检查数据,甚至不能开处方。业务系统的稳定运行和持续可用,对于各行业顺利开展各种业务是不可或缺的,因此能够对业务系统的可用性进行正确评估是极为重要的。

图1为业务系统网络拓扑图。如图1所示,该业务系统包括柜台终端、接入交换机、核心交换机、服务器区接入交换机和用于提供业务服务的业务系统服务器。当评估图1所示的业务系统的可用性时,现有技术中通常是分别对构成业务系统的多个节点,即柜台终端、接入交换机、核心交换机、服务器区接入交换机和业务系统服务器的性能指标或故障状态进行评估,并通过将评估结果进行简单累加来评估当前业务系统的可用性。

当利用上述方法评估系统的可用性时,仅将业务系统的可用性作为多个节点的简单集合,并未考虑节点之间的关联性。但在实际应用中,例如图1中的第一核心交换机A1和第二核心交换机A2组成双核心冗余结构,如果第一核心交换机A1宕机,则只会导致第一业务系统服务器H、第二业务系统服务器N和第三业务系统服务器M的可用性存在隐患;如果第二核心交换机A2也宕机,则会导致第一业务系统服务器H、第二业务系统服务器N和第三业务系统服务器M完全不能访问;如果第二服务器区接入交换机C与第二业务系统服务器N之间的链路断开,则只有第二业务系统服务器N无法访问,而第一业务系统服务器H和第三业务系统服务器M可正常运用。可以看出,业务系统中节点间的关系与系统可用性之间存在密切关联,按照上述现有技术中的评估方法不能够准确获知业务系统的当前真实状态。

发明内容

针对上述缺陷,本发明提供一种业务系统可用性评估方法及系统,用以实现业务系统可用性的有效、准确评估。

本发明提供的业务系统可用性评估方法包括:

监测业务系统中网元故障事件,根据预设规则获取网元的健康分值,所述网元包括节点和链路;

根据节点在业务系统路径中出现的次数获取节点的权重;

根据链路关联节点获取链路的权重;

根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性。

本发明提供的业务系统可用性评估系统包括:

健康分值计算模块,用于监测业务系统中各网元故障事件,根据预设规则获取网元的健康分值,所述网元包括节点和链路;

节点权重计算模块,根据节点在业务系统路径中出现的次数获取节点的权重;

链路权重计算模块,用于根据链路关联节点获取链路的权重;

业务系统可用性评估模块,用于根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性。

根据本发明的业务系统可用性评估方法及系统,由于不仅通过监测节点和链路的故障事件获取网元的健康分值,还通过分析业务系统中各网元之间的关联性,即业务系统的路径,根据各网元对于业务系统可用性的影响度的不同为各网元设置不同的权重,并结合网元的权重及其健康分值来评估业务系统的可用性,所以能够根据业务系统的具体架构对其当前可用状态进行有效、准确的评估。

附图说明

图1为业务系统网络拓扑图。

图2为本发明业务系统可用性评估方法的流程图。

图3为广度优先遍历算法的遍历流程示意图。

图4为本发明业务系统可用性评估系统的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图,对本发明的技术方案进行清楚、完整地描述。

图2为本发明业务系统可用性评估方法的流程图。如图2所示,该业务系统可用性评估方法包括:

步骤S100,监测业务系统中网元故障事件,根据预设规则获取网元的健康分值,所述网元包括节点和链路;

具体地,以图1中所示的业务系统为例,对该业务系统可用性评估方法进行说明。如图1所示的拓扑结构包括以下节点:第一接入交换机D、第二接入交换机E、第三接入交换机F、第四接入交换机G、第一核心交换机A1、第二核心交换机A2、第一服务器区接入交换机B、第二服务器区接入交换机C、第一业务系统服务器H、第二业务系统服务器N和第三业务系统服务器M。图1中包括分别对应于三个业务系统服务器的业务系统。各业务系统的网元除包括以上节点中的相关节点之外,还包括任意两个相连节点之间的链路,例如第一接入交换机D与第一核心交换机A1之间的链路和第一核心交换机A1与第一服务器区接入交换机B之间的链路等。

对图1中的各网元进行监测,以获知其是否发生故障事件,例如设备CPU利用率超过阈值事件、接口闪断事件和以太网地址解析协议(ARP)攻击等故障事件,所需进行监测的故障事件类型可预先设定。获知各网元是否发生预定的各种故障事件后,可根据预设规则获取网元的健康分值。

步骤S200,根据节点在业务系统路径中出现的次数获取节点的权重;

具体地,在图1中所示的业务系统中,柜台终端A通过四个接入交换机接入业务系统(图1中以通过第二接入交换机E接入该业务系统为示例),要获取一业务系统服务器H提供的业务服务时,即需形成柜台终端A至第一业务系统服务器H的路径。符合上述条件的路径有16条,与各接入交换机对应的有4条,以第二接入交换机E为例,包括:第一路径(柜台终端A、第二接入交换机E、第一核心交换机A1、第一服务器区接入交换机B、第一业务系统服务器H);第二路径(柜台终端A、第二接入交换机E、第二核心交换机A2、第一服务器区接入交换机B、第一业务系统服务器H);第三路径(柜台终端A、第二接入交换机E、第二核心交换机A2、第一核心交换机A1、第一服务器区接入交换机B、第一业务系统服务器H);第四路径(柜台终端A、第二接入交换机E、第一核心交换机A1、第二核心交换机A2、第一服务器区接入交换机B、第一业务系统服务器H)。可以得知,在全部的16条路径中,第二接入交换机E出现在其中4条路径中,则第二接入交换机E对于由业务系统服务器H提供业务服务的业务系统的权重是0.25。

步骤S300,根据链路关联节点获取链路的权重;

具体地,与节点相类似,不同节点间的链路在业务系统中所占的权重也不相同,并且两节点之间的链路的权重取决于该两个关联节点的权重。该链路权重值例如为两节点权重的平均值或为其中任一节点的权重,优选地,根据链路关联的两个节点中距离业务系统中的业务系统服务器较远的节点获取链路的权重,例如计算第二接入交换机E与第一核心交换机A1之间的链路权重时,由于第二接入交换机E相对于第一核心交换机A1距离第一业务系统服务器H较远,因此应取第二接入交换机E的权重作为该链路的权重。

步骤S400,根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性。

具体地,根据在步骤S100中获取的业务系统中各网元的健康分值、在步骤S200中获取的节点的权重和在步骤S300中获取的链路的权重按照预定算法来评估业务系统的可用性。其中,该预定算法可包括多种,例如将业务系统中各网元健康分值与其对应的网元权重的乘积进行累加,或根据网元健康分值及网元权重计算业务系统中的各路径健康度,并综合业务系统中的全部路径的健康度计算业务系统的可用性。

根据上述实施例的业务系统可用评估方法,由于不仅通过监测节点和链路的故障事件获取网元的健康分值,还通过分析业务系统中各网元之间的关联性,即业务系统的路径,根据各网元对于业务系统可用性的影响度的不同为各网元设置不同的权重,并结合网元的权重及其健康分值来评估业务系统的可用性,所以能够根据业务系统的具体架构对其当前可用状态进行有效、准确的评估。

进一步地,在上述实施例的业务系统可用评估方法中,所述监测业务系统中各网元故障事件,根据预设规则,获取网络网元的健康分值的步骤包括:

步骤S101,建立网元健康评估列表,所述网元健康评估列表包括网元故障事件和与所述网元故障事件对应的评分原则;

步骤S102,监测网元故障事件并通过查询所述网元健康评估列表获取故障事件对应的评分原则;

步骤S103,根据所述评分原则获取网元的健康分值。

具体地,表1为健康评估列表的一个示例。

表1

如表1所示,健康分值的初始值为100分,各故障事件具有与其对应的扣分分值,例如当某一网元发生电源故障时,健康分值下降50分,则健康分值为50分。

当网元关联多个故障事件时,若该多个故障事件属于相同类型,则只取该多个故障事件中等级最高的一个(即扣除分数最多的一个)来计算网元的健康分值。其中,相同类型的故障是指通常由同一个故障源导致的多种故障,例如表1中所示的ARP攻击事件、ARP拒绝服务攻击和ARP扫描攻击属于同一类型的故障事件;链路DOWN、设备不可达事件和拓扑关键路径不可达属于同一类型的故障事件;接口接收速率阈值越界事件、接口发送速率阈值越界事件和流量连续超过阈值属于同一类型的故障事件。采用这种方式能够避免在网元因一个故障源产生多个故障时,扣除其过多的健康分值,从而导致结果不准确。

当网元关联多个不同类型的故障事件时,则对该多个故障事件的扣分分值进行由高到低的排序,并采用下述公式1累加这些故障事件导致的健康分值扣分,直至健康分值降至0分。

网元健康分值=100-S1-S2/2-......-Sn/n    公式1

在上述公式1中,n为网元关联的不同类型的故障事件的数目,Sn为第n个故障事件所需扣除的健康分值,并且满足S1≥S2≥...≥Sn。例如:网元有3个不同类型的故障事件,该3个故障事件分别导致的扣分分值为30分、20分和10分,则该网元的健康分值为100-30-20/2-10/3=56.7分。

虽然这里例示了按照公式1计算网元的健康分值,但也可采取其他方式:例如用100分直接减去多个故障事件的扣分分值,但由于按照这种方式计算的健康分值有较大可能性为0,对于健康分值为0的多个网元无法有效区分其当前状态差异,因此优选采用上述公式1计算网元的健康分值,能够更为直观地反映网元的健康状况。

进一步地,在上述实施例的业务系统可用性评估方法,所述根据节点在业务系统相关路径中出现的次数获取网络网元的权重的步骤包括:

步骤S201,获取业务系统路径;

步骤S202,若检测获知某一路径未包含其他任一路径的全部节点,则确定所述路径为有效路径;

步骤S203,根据节点出现在所述有效路径中的次数获取节点的权重。

具体地,例如采用现有技术中的“广度优先遍历算法”获取业务系统的全部路径。图3为广度优先遍历算法的遍历流程示意图,其中所标示的数字代表算法对节点的遍历顺序,其中标号为1的节点为起点。如图3所示,广度优先遍历的顺序是分层的、在每一层上尽量多地访问所有“兄弟”节点。

具体地,由于按照上述广度优先遍历算法获取业务系统的全部路径后,该全部路径会包含一些无效路径,例如在如图1中所示的第一业务系统服务器H对应的业务系统中,第三路径(柜台终端A、第二接入交换机E、第二核心交换机A2、第一核心交换机A1、第一服务器区接入交换机B、第一业务系统服务器H)和第四路径(柜台终端A、第二接入交换机E、第一核心交换机A1、第二核心交换机A2、第一服务器区接入交换机B、第一业务系统服务器H)分别包含了第一路径和第二路径中的全部网元,只是在其基础上增加了第一核心交换机A1与第二核心交换机A2之间的链路,所以将第三路径和第四路径作为无效路径丢弃,并仅结合排除全部无效路径后剩余的有效路径计算网元权重。

根据上述实施例的业务系统可用性评估方法,在获取业务系统路径后,对路径是否为有效路径进行判断,将包含了其他路径的全部节点的无效路径丢弃,所以在计算节点权重过程中,通过排除这些无效路径,并仅考虑节点出现在有效路径中的次数,能够避免重复考虑节点的重要性,计算出的权重更为准确。

进一步地,在上述实施例的业务系统可用性评估方法中,根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性的步骤包括:

步骤S401,根据网元的健康分值和网元的权重获取路径健康分值;

步骤S402,根据所述路径健康分值计算所述业务系统的可用性分值。

具体地,对各路径所涉及的网元中的非健康网元(即健康分值低于100分的网元)进行健康分值由低到高的排序,排在第n位的网元的健康分值对于该路径的健康分值的影响为网元健康分值/n,即为该路径的健康分值减去(100-网元健康分值)/n。例如路径中有两个网元出现故障,第一个网元的健康度为70,第二个网元的健康度为80,则该路径的健康分值为100-(100-70)-(100-80)/2=60分。进一步地,若路径中包含任何网元不可达故障(例如设备不可达或链路DOWN或拓扑关键路径不可达),则该路径的健康分值立即下降为0。

在获取到该业务系统的全部路径健康分值后,按照路径健康分值由低到高的顺序对不健康路径进行排序,并根据下述公式2计算业务系统可用性分值:

F(n)=100-K(1×S1+1/2×S2+1/3×S3+......+1/n×Sn)    公式2

其中,n为不健康的路径的个数,Sn为第n条路径的健康分值下降得分(优选采取1分制,例如第n条路径的路径健康分值为80分,即扣除了健康分值20分,则健康分值下降得分为0.2),K为一个常数,其可根据下述公式3计算获得:

K(1+1/2+1/3+......+1/N)=100    公式3

其中,N为业务系统的所有路径数目,优选为所有有效路径数目。

例如,某个业务系统具有的有效路径数目为240条,那么根据公式3计算出此时的K值为16.5。此时,如果业务系统中有且仅有一个网元出现不可达故障,且该网元承载业务系统的路径数目为4条,则导致4条路径完全不可达,即这4条路径的健康分值下降得分为1,则根据公式2计算出业务系统可用性分值F(n)=100-16.5(1×1+1/2×1+1/3×1+1/4×1)=65.9。此种情况例如为当有120台接入交换机访问图1中所示的第一业务系统服务器H,某一接入交换机宕机时,则第一业务系统服务器H对应的业务系统的可用性分值为65.9。

虽然这里例示了结合公式2和公式3来计算业务系统可用性分值,但也可采取其他方式:例如根据下述公式4进行计算:

F(n)=100-K(S1+S2+S3+......+Sn)    公式4

其中,K=100/N,。但按这种方式计算时,例如当有120接入交换机访问图1中所示的第一业务系统服务器H,某一接入交换机宕机时,则计算出的业务系统可用性分值为F(n)=100-100(1+1+1+1)/240=98.3,由于在这种计算方法中为各路径赋予相同的权重,所以此时计算出的业务系统可用性分值较高,其忽略了不健康路径对于业务系统存在的较大隐患,因此优选采取上述结合公式2和公式3来计算业务系统可用性分值。

根据上述实施例的业务系统可用性评估方法,由于业务系统的可用性实质上来源于业务系统各路径的运行状况,而业务路径与网元之间是多对多的关系,即一个网元出现故障,可能影响多个路径;而多个网元出现故障,可能仅影响一个路径,因此首先根据网元计算路径的健康分值,再根据路径的健康分值计算业务系统的可用性分值,能够获得准确、真实的业务系统当前状态。

图4为本发明业务系统可用性评估系统的结构示意图。如图4所示,业务系统可用性评估系统包括:

健康分值计算模块,用于监测业务系统中各网元故障事件,根据预设规则获取网元的健康分值,所述网元包括节点和链路;

节点权重计算模块,根据节点在业务系统路径中出现的次数获取节点的权重;

链路权重计算模块,用于根据链路关联节点获取链路的权重;

业务系统可用性评估模块,用于根据所述网元的健康分值和所述网元的权重按照预定算法评估业务系统可用性。

上述实施例的业务系统可用性评估系统执行业务系统可以是独立设置在业务系统的网络中的服务器,其执行业务系统可用性评估的流程与上述任一实施例的业务系统可用性评估方法相同,故此处不再赘述。

根据上述实施例的业务系统可用性评估系统由于不仅通过监测节点和链路的故障事件获取网元的健康分值,还通过分析业务系统中各网元之间的关联性,即业务系统的路径,根据各网元对于业务系统可用性的影响度的不同为各网元设置不同的权重,并结合网元的权重及其健康分值来评估业务系统的可用性,所以能够结合业务系统的具体架构对其当前可用状态进行有效、准确的评估。

进一步地,在上述实施例的业务系统可用性评估系统中,所述健康分值计算模块包括:

网元评估列表建立单元,用于建立网元健康评估列表,所述网元健康评估列表包括网元故障事件和与所述网元故障事件对应的评分原则;

网元监测单元,用于监测网元故障事件并通过查询所述网元健康评估列表获取故障事件对应的评分原则;

健康分值计算单元,用于根据所述评分原则获取网元的健康分值。

进一步地,在上述实施例的业务系统可用性评估系统中,节点权重计算模块包括:

路径获取单元,用于获取业务系统路径;

路径检测单元,用于若检测获知某一路径未包含其他任一路径的全部节点,则确定所述路径为有效路径;

节点权重获取单元,用于根据节点出现在所述有效路径中的次数获取节点的权重。

进一步地,在上述实施例的业务系统可用性评估系统中,链路权重计算模块包括:

相关节点权重获取单元,用于获取链路关联的两个节点的权重;

链路权重获取单元,用于根据链路关联的两个节点的权重的平均值或其中任一节点的权重确定链路的权重。

进一步地,在上述实施例的业务系统可用性评估系统中,业务系统可用性评估模块包括:

路径健康分值获取单元,用于根据网元的健康分值和网元的权重获取路径健康分值;

业务系统可用性分值评估单元,用于根据所述路径健康分值计算所述业务系统的可用性分值。

根据上述任一实施例的业务系统可用性评估系统,能够将业务系统可用性分值和实现的网络故障(即网元的故障事件)联系起来,提供显示、分析界面,以便于系统管理员的监控。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号