首页> 中国专利> 基于云计算的下一代关键信息基础设施网络智能管理系统

基于云计算的下一代关键信息基础设施网络智能管理系统

摘要

本发明提供一种基于云计算的下一代关键信息基础设施网络智能管理系统,其中每个关键信息基础设施表示为网络中的一个设备,包括:数据采集模块,设置在所述网络的设备中,用于采集所述设备的运行状态数据,以及发送和接收的网络数据;云管理模块,用于对所述数据进行监控处理,判断网络中设备的性能情况,生成相应的异常消息并发送到智能分析模块;所述智能分析模块,用于接收所述异常消息后对所述存在异常的设备进行分析,分析其异常类型,生成处理对策信息发送到管理终端;所述管理终端,用于接收由所述智能分析模块发送的处理对策信息并显示。本发明覆盖范围大,智能化水平高,方便管理者对网络中设备性能状态的查看和异常状态的处理。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-04

    授权

    授权

  • 2018-09-11

    实质审查的生效 IPC(主分类):H04L12/24 申请日:20180604

    实质审查的生效

  • 2018-08-17

    公开

    公开

说明书

技术领域

本发明涉及网络技术领域,特别是一种基于云计算的下一代关键信息基础设施网络智能管理系统。

背景技术

现有技术中,对下一代关键信息基础设施网络的监控和管理采用依据地域为基础的范围区域管理系统对网络中同一地域或地域靠近的基础设施进行管理,但是,基础设施之间的信息互通并不受到地域的限制,不同地域的基础设施也会进行数据互通;同时,由于关键信息基础设施网络中设备的数量庞大,采用小范围的管理系统也无法对网络中的所有设施同时进行监控和管理,使得管理者对全国范围内的关键信息基础设施的管理带来不便。

发明内容

针对上述问题,本发明旨在提供基于云计算的下一代关键信息基础设施网络智能管理系统。

本发明的目的采用以下技术方案来实现:

一种基于云计算的下一代关键信息基础设施网络智能管理系统,其中每个关键信息基础设施表示为网络中的一个设备,包括:

数据采集模块,设置在所述网络的设备中,用于采集所述设备的运行状态数据,以及发送和接收的网络数据;

云管理模块,用于收集所述数据采集模块采集到的数据,对所述数据进行监控处理,判断网络中设备的性能情况,当发现所述设备存在异常时,生成相应的异常消息并发送到智能分析模块;

所述智能分析模块,用于接收所述异常消息后对所述存在异常的设备进行分析,分析其异常类型和种类,并从云端数据库中匹配相应的处理方案,生成处理对策信息发送到管理终端,其中所述处理对策信息携带有所述处理方案;

所述管理终端,用于接收由所述智能分析模块发送的处理对策信息并显示。

在一种实施方式中,所述管理终端还用于当确认执行所述处理对策信息中的处理方案时,向执行模块发送相应的执行指令;

所述系统还包括所述执行模块,用于当接收到所述执行指令时根据所述处理方案控制所述存在异常的设备执行相应的操作。

在一种实施方式中,所述云管理模块包括网络性能监测单元,用于对所述网络进行监测,性能态势评估和异常定位;

在一种实施方式中,所述网络性能监测单元包括:抽样检测子单元、异常定位子单元和异常排查子单元;

所述抽样检测子单元,用于抽样对数据采集模块中采集的所述设备的所述网络数据进行检测处理,其中所述网络数据包括数据量、传输路径、持续时间、丢包率、数据发送及接受设备标识;

所述异常定位子单元,根据所述抽样检测子单元的抽样检测结果,定位所述网络中可能存在异常状态的设备;

所述异常排查子单元,对所述可能存在异常状态的设备进行检测和排查,当发现所述设备存在异常时,生成相应的警报消息并发送到所述管理终端。

在一种实施方式中,抽样检测子单元,还包括:抽样对网络中的设备进行往返时延评估,判断该设备产生的网络数据的数据传输路径中的设备是否存在异常;

其中采用的第一往返时延评估函数为:

式中,ζ表示网络中设备在数据传输过程中的平均往返时延,u表示设备发送端口的套接字缓冲区大小,h表示该数据传输的流记录持续时间,m表示总数据量,d表示丢包率,p和q表示传输控制协议中的拥塞控制策略中的控制常数;

将设备在数据传输过程中的平均往返时延和设定的往返时延阈值进行比较,如果获取的平均往返时延大于设定的阈值,则判断该数据传输路径中的设备可能存在异常,否则认为该数据传输路径中的设备不存在异常。

在一种实施方式中,所述抽样检测子单元,还包括:所述抽样对网络中的设备进行往返时延评估之前,判断设备进行数据交互时的丢包率d是否大于自适应丢包率阈值dy,其中,自适应丢包率阈值函数为:

式中,dy表示设备的自适应丢包率阈值,u表示设备发送端口的套接字缓冲区大小,h表示该数据传输的流记录持续时间,m表示总数据量,p和q表示传输控制协议中的拥塞控制策略中的控制常数;

当丢包率d小于自适应丢包率阈值dy时,采用上述第一往返时延评估函数评估设备在数据传输过程中的平均往返时延;

当丢包率d大于自适应丢包率阈值dy时,采用下列第二往返时延评估函数评估设备在数据传输过程中的平均往返时延,其中所述第二往返时延评估函数为:

式中,ζ表示网络中设备在数据传输过程中的平均往返时延,h表示该数据传输的流记录持续时间,m表示总数据量,d表示丢包率,p和q表示传输控制协议中的拥塞控制策略中的控制常数。

本发明的有益效果为:通过数据采集模块对网络中设备的数据进行采集,并将采集得到的数据上传到云管理模块中集中处理,覆盖范围大,通过云管理模块对采集到的数据进行监控、分析和处理,判断网络中各设备的及网络整体的性能情况,发现网络中存在异常的设备并对其进行智能分析,匹配相应的处理方案并反馈给管理终端,管理者通过管理终端向执行模块发送执行指令,执行模块根据匹配的处理方案控制存在异常的设备完成相应的处理操作,智能化水平高,方便管理者对网络的性能状态的查看和异常情况的处理。

附图说明

利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1为本发明的框架结构图;

图2为本发明云管理模块的框架结构图;

图3为本发明共享风险链路组图示意图。

具体实施方式

结合以下应用场景对本发明作进一步描述。

参见图1,其示出了一种基于云计算的下一代关键信息基础设施网络智能管理系统,其中每个关键信息基础设施表示为网络中的一个设备,包括:

数据采集模块110,设置在所述网络的设备中,用于采集所述设备的运行状态数据,以及发送和接收的网络数据;

云管理模块120,用于收集所述数据采集模块110采集到的数据,对所述数据进行监控处理,判断网络中设备的性能情况,当发现所述设备存在异常时,生成相应的异常消息并发送到智能分析模块130;

所述智能分析模块130,用于接收所述异常消息后对所述存在异常的设备进行分析,分析其异常类型和种类,并从云端数据库中匹配相应的处理方案,生成处理对策信息发送到管理终端140,其中所述处理对策信息携带有所述处理方案;

所述管理终端140,用于接收由所述智能分析模块130发送的处理对策信息并显示。

在一种实施方式中,所述管理终端140还用于当确认执行所述处理对策信息中的处理方案时,向执行模块150发送相应的执行指令;

所述系统还包括所述执行模块150,用于当接收到所述执行指令时根据所述处理方案控制所述存在异常的设备执行相应的操作。

在一种实施方式中,所述异常类型包括设备中传输模块发生异常,设备应用模块发生异常或设备进程发生异常等。

本发明上述实施方式,通过数据采集模块对网络中设备的数据进行采集,并将采集得到的数据上传到云管理模块中集中处理,覆盖范围大,通过云管理模块对采集到的数据进行监控、分析和处理,判断网络中各设备的及网络整体的性能情况,发现网络中存在异常的设备并对其进行智能分析,匹配相应的处理方案并反馈给管理终端,管理者通过管理终端向执行模块发送执行指令,执行模块根据匹配的处理方案控制存在异常的设备完成相应的处理操作,智能化水平高,方便管理者对网络的性能状态的查看和异常情况的处理。

在一中场景中,在挑选出的设备上设置网关节点,所述网关节点用于先收集其附近数据采集模块采集的数据,再发送至云管理模块;所述采集模块组成网状式网络,将采集到的数据通过传输链路发送到网关节点中,由网关节点将该数据发送到云管理模块。

在一种实施方式中,参见图2,所述云管理模块120包括网络性能监测单元121,用于对所述网络进行监测,性能态势评估和异常定位;

在一种实施方式中,所述网络性能监测单元121包括:抽样检测子单元123、异常定位子单元124和异常排查子单元125;

所述抽样检测子单元123,用于抽样对数据采集模块中采集的所述设备的所述网络数据进行检测处理,其中所述网络数据包括数据量、传输路径、持续时间、丢包率、数据发送及接受设备标识;

所述异常定位子单元124,根据所述抽样检测子单元123的抽样检测结果,定位所述网络中可能存在异常状态的设备;

所述异常排查子单元125,对所述可能存在异常状态的设备进行检测和排查,当发现所述设备存在异常时,生成相应的警报消息并发送到所述管理终端。

本发明上述实施方式,通过设置抽样检测子单元来对系统中设备进行抽样检测,并通过异常定位子单元对抽样检测的数据进行处理和分析,找出网络中可能存在异常的设备,最后通过异常排查子单元对可能存在异常的设备进行异常排查处理,确定该设备当前的性能状态,并反馈到云管理系统中,智能化水平高,方便管理者对关键信息基础设施网络的管理。

在一种实施方式中,抽样检测子单元123,还包括:抽样对网络中的设备进行往返时延评估,判断该设备产生的网络数据的数据传输路径中的设备是否存在异常;

其中采用的第一往返时延评估函数为:

式中,ζ表示网络中设备在数据传输过程中的平均往返时延,u表示设备发送端口的套接字缓冲区大小,h表示该数据传输的流记录持续时间,m表示总数据量,d表示丢包率,p和q表示传输控制协议中的拥塞控制策略中的控制常数;

将设备在数据传输过程中的平均往返时延和设定的往返时延阈值进行比较,如果获取的平均往返时延大于设定的阈值,则判断该数据传输路径中的设备可能存在异常,否则认为该数据传输路径中的设备不存在异常。

由于主动测量方法(即从数据采集模块反馈的数据发出时间和响应时间差来计算往返时延)虽然能得到很高的往返时延测量精度,但是由于关键信息基础设施网络中的设备数量庞大,要在每个设备中设置测量设备会带来巨大的维护成本,同时往返时延测量设备也容易受到入侵,安全性能不高,因此,本发明上述实施方式,采用基于流记录的被动测量的方法对网络中设备与其他设备的数据交互时的往返时延进行测量,通过云系统收集由数据采集模块中采集的系统中不同传输链路的传输数据并进行分析,准确估计出设备数据传输的往返时延,从而判断传输路径中的设备是否存在异常,处理方法简单,能够有效减轻系统的负担。

在一种实施方式中,所述抽样检测子单元123,还包括:所述抽样对网络中的设备进行往返时延评估之前,判断设备进行数据交互时的丢包率d是否大于自适应丢包率阈值dy,其中,自适应丢包率阈值函数为:

式中,dy表示设备的自适应丢包率阈值,u表示设备发送端口的套接字缓冲区大小,h表示该数据传输的流记录持续时间,m表示总数据量,p和q表示传输控制协议中的拥塞控制策略中的控制常数;

当丢包率d小于自适应丢包率阈值dy时,采用上述第一往返时延评估函数评估设备在数据传输过程中的平均往返时延;

当丢包率d大于自适应丢包率阈值dy时,采用下列第二往返时延评估函数评估设备在数据传输过程中的平均往返时延,其中所述第二往返时延评估函数为:

式中,ζ表示网络中设备在数据传输过程中的平均往返时延,h表示该数据传输的流记录持续时间,m表示总数据量,d表示丢包率,p和q表示传输控制协议中的拥塞控制策略中的控制常数。

本发明上述实施方式,通过对抽样检测子单元中设置自适应丢包率阈值,根据丢包率情况来判断采用不同的返时延评估函数来评估设备在数据传输过程中的平均往返时延,能够适应不同情况下对设备往返时延的估计,提高准确度。

在一种实施方式中,所述异常定位子单元124中,定位可能存在异常的网络设备,具体包括:

准备阶段:参见图3,根据设备网络构建共享风险链路组图W=(X,Y,Z),其中节点X={xi对应网络中每个设备,节点Y={yi}表示测量路径,每条测量路径对应所述抽样检测子单元123中的一个抽样评估结果;边集Z中有一条xi到yj的边,表示第j条路径包含第i条边;

初始化阶段:分别初始化集合ηH、ηS、Qω为空集其中ηS表示软子句集合,ηH表示硬子句集合,Qω表示对于每个属于ηS的子句r,如果满足子句r时获取的权重集合;

命题阶段:

(1)将经所述异常排查子单元125排查后确定有异常的设备xi添加到集合RH中,并且将它们的变量的肯定文字组成的子句ri添加到硬子句集合ηH;而采用表示经系统排查后确定没有异常的设备xi的集合,将它们对应的变量的否定文字组成的子句ri添加到硬子句集合ηH;其中,赋值ri=ture即表示设备xi的性能是异常的反之则是正常的;

(2)获取所述抽样检测子单元123中对应于测量路径yi的对应的平均往返时延τ作为异常值gi,当gi大于设定的判定阈值δ时,将共享风险链路组图W中yi的所有连接设备对应的肯定文字组成一条子句,并将它添加到软子句集合ηS中,同时将这个软子句的权重设定为Qω(yi)=Qα(gi),其中,

式中,α表示权重调整因子,表示向下取整函数;

(3)对于每一个还没有被系统排查的网络设备xi,将这些设备对应的变量的否定文字分别组成的单文字子句添加到软子句集合ηS中,同时另他们的权重其中,pxi表示根据历史数据该设备发生异常的先验概率,其中,

式中,β表示权重调整因子;

(4)采用主成分分析获取当前周期对应于测量路径yi的异常值gi,当gi小于设定的判定阈值δ时,将共享风险链路组图W中yi所有邻接点对应的否定文字组成一条子句并将它添加到软子句集合ηS中,同时将这个软子句的权重设定为Qω(yi)=Qx(gi),其中,

式中,γ表示权重调整因子,n表示测量路径中邻接点的数量;

求解阶段:

找出所有包含在软子句集合ηS中的k个变量,并找出这k个变量的一组赋值,使得在其他未确定的变量赋值ri为False时所满足的软子句的权重和最大,将满足这一条件的k个变量的赋值对应的文字逐个添加到硬子句集合ηH中,

重复上述步骤直到所有变量赋值都被确定并添加到硬子句集合ηH中;

采用η=ηH作为命题公式,建立可满足性问题,并求解所述可满足性问题获取最有可能出现性能异常的设备。

在一种实施方式中,参见图3,节点y4分别与节点x1、x2、x5连接,即表示在所述性抽样检测子单元123的一次抽样评估中,抽样的数据为设备x1发出的网络数据经节点x2传输到节点x5

本发明上述实施方式,采用上述的方法建立可满足性问题对网络中可能出现异常的设备进行定位,将经过判断确定出现异常或正常设备的肯定文字或否定文字(如变量、变量的取值或判断依据)添加到硬子句集合中,作为之后判断设备是否出现异常的依据;通过对抽样测量路径的平均往返时延的估计作为判断依据(当一条测量链路存在异常时,至少次路径中的一个设备存在异常),判断该测量路径中设备是否可能出现异常,并将这些设备对应的肯定文字或否定文字添加到软子句集合中并依据各自的权重做进一步分类处理,获取其中有效的文字添加到硬子句集合中作为判断依据;最后通过采用硬子句集合作为命题公式,建立可满足性问题,并对此可满足性问题进行求解,获取最可能存在异常的设备供系统作进一步排查处理;本发明上述方法,仅需通过云系统采集网络中少量测量点的数据作为依据,就能获取网络中异常设备的定位,减轻的系统的负担。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当分析,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号