首页> 中国专利> 容器化平台核心组件的检测及告警方法、装置及设备

容器化平台核心组件的检测及告警方法、装置及设备

摘要

本发明涉及本发明提供的一种容器化平台核心组件的检测及告警方法、装置及设备,方法包括:以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,根据健康监测访问的返回状态码,确定健康监测访问的结果,若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置,以实现对故障的快速检测和及时维护,不受核心组件的影响,有效地减少了对用户的业务影响。

著录项

  • 公开/公告号CN112181780A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利权人 广州欢网科技有限责任公司;

    申请/专利号CN202011085312.9

  • 发明设计人 王恺;

    申请日2020-10-12

  • 分类号G06F11/30(20060101);G06F11/32(20060101);H04L29/08(20060101);

  • 代理机构11471 北京细软智谷知识产权代理有限责任公司;

  • 代理人牛晴

  • 地址 510000 广东省广州市番禺区小谷围街中二横路22号A513-A514

  • 入库时间 2023-06-19 09:27:35

说明书

技术领域

本发明属于系统维护技术领域,具体涉及一种容器化平台核心组件的检测及告警方法、装置及设备。

背景技术

在目前的容器化平台环境中,监控与告警是必不可少的一个关键环节,及时的告警可以在很大程度上提高对于异常故障的处理速度以及定位问题的速度。目前,容器化平台集成外部的监控平台项目对组件进行监控过程,绝大多数的监控组件的告警方法均需要容器化平台核心组件对监控及告警数据信息进行汇总聚合再对外发送告警。

但是,当核心组件自身出现问题时,则会导致该报警无法成功发送,等同于告警链路失效,导致用户容易受到较大的业务损失。

发明内容

为了至少解决现有技术存在的上述问题,本发明提供了一种容器化平台核心组件的检测及告警方法、装置及设备,以实现对故障的快速检测和快速维修,减少对用户带来的业务损失。

本发明提供的技术方案如下:

一方面,一种容器化平台核心组件的检测及告警方法,包括:

以预设时间频率对容器化平台集群内的所有组件进行健康监测访问;

根据所述健康监测访问的返回状态码,确定所述健康监测访问的结果;

若所述结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使所述事件告警发送中心发送所述告警信息至用户终端,所述告警信息包括故障类型和故障位置。

可选的,上述所述以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,包括:

获取所述容器化平台集群内的所有组件的访问路径,所述访问路径为所述所有组件对外提供的API接口;

基于所述访问路径,通过自定义事件监控单元按照预设时间对容器化平台集群内的所有组件进行健康监测访问,所述预设时间为用户端自行设定的时间间隔。

可选的,上述所述结果显示异常包括:返回状态码表示访问失败或返回状态码表示当前状态与目标状态不一致。

可选的,上述所述事件告警发送中心发送所述告警信息至用户终端,包括:

所述事件告警发送中心以邮件或短信的方式发送所述告警信息至用户终端。

可选的,上述所述的检测及告警方法,还包括:

更新所述用户终端的地址信息。

另一方面,一种容器化平台核心组件的检测及告警装置,包括:

检测模块,用于以预设时间频率对容器化平台集群内的所有组件进行健康监测访问;

确定模块,用于根据所述健康监测访问的返回状态码,确定所述健康监测访问的结果;

告警模块,用于若所述结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使所述事件告警发送中心发送所述告警信息至用户终端,所述告警信息包括故障类型和故障位置。

可选的,上述所述检测模块具体用于:

获取所述容器化平台集群内的所有组件的访问路径,所述访问路径为所述所有组件对外提供的API接口;

基于所述访问路径,通过自定义事件监控单元按照预设时间对容器化平台集群内的所有组件进行健康监测访问,所述预设时间为用户端自行设定的时间间隔。

可选的,上述所述结果显示异常包括:返回状态码表示访问失败或返回状态码表示当前状态与目标状态不一致。

可选的,上述所述告警模块具体用于:

所述事件告警发送中心以邮件或短信的方式发送所述告警信息至用户终端。

再一方面,一种容器化平台核心组件的检测及告警设备,包括:处理器,以及与所述处理器相连接的存储器;

所述存储器用于存储计算机程序,所述计算机程序至少用于上述任一项所述的容器化平台核心组件的检测及告警方法;

所述处理器用于调用并执行所述存储器中的所述计算机程序。

本发明的有益效果为:

本发明提供的一种容器化平台核心组件的检测及告警方法、装置及设备,方法包括:以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,根据健康监测访问的返回状态码,确定健康监测访问的结果,若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置,而上述的整体检测、告警链路流程完全不需要核心组件自身聚合并提供监控指标数据,自定义事件监控程序会基于各个核心组件对外提供的公开API接口进行检测访问,并且在检测到异常时基于不同类型的核心组件异常信息,通过内置SDK直接发送对应的自定义事件告警给事件告警发送中心,即使集群各组件异常对该自定义事件监控告警链路也没有任何影响,并且完全不依赖监控指标数据而仅基于访问的返回状态码以及检测访问是否成功来发送自定义事件告警,保证了即使核心组件出现故障,维修人员也能进行及时的维修,有效地减少对用户带来的业务损失。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的容器化平台核心组件的检测及告警方法的一种流程图;

图2是本发明实施例提供的容器化平台核心组件的检测及告警装置的一种结构示意图;

图3是本发明实施例提供的容器化平台核心组件的检测及告警设备的一种结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。

图1是本发明实施例提供的容器化平台核心组件的检测及告警方法的一种流程图。

如图1所示,本实施例提供的一种容器化平台核心组件的检测及告警方法,包括以下步骤:

S11、以预设时间频率对容器化平台集群内的所有组件进行健康监测访问。

具体的,以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,可以包括:获取容器化平台集群内的所有组件的访问路径,访问路径为所有组件对外提供的API(Application Programming Interface,应用程序接口),然后基于访问路径,通过自定义事件监控单元按照预设时间对容器化平台集群内的所有组件进行健康监测访问,预设时间为用户端自行设定的时间间隔,例如每间隔30秒进行一次健康监测访问,当然,预设时间频率为用户自行设定的,可以根据实际需求进行更改或调整。所有组件包括容器化平台内的各个节点,例如Node节点、Master节点等等,不再进行一一的举例说明。

S12、根据健康监测访问的返回状态码,确定健康监测访问的结果。

在进行了健康监测访问以后,需要对访问的结果进行明确的指示,而可以通过返回的状态码表示健康监测访问的结果,若返回状态码表示正常,检测成功则表明此时的各组件均正常工作,无异常,便继续保持当前运行状态。还有一种情况则是发现某一组件出现异常,异常的表现可能是健康监测访问失败或者是返回状态码表示的状态与目标状态不一致,表明此时监测的组件出现了异常现象,目标状态指的是正常工作时的预期状态,当前状态与预期状态不符,则表明此时监测访问的组件出现了异常,关于具体的返回状态码的类型表示各种不同的状态的定义不再进行具体说明,可以根据实际需求进行决定。

S13、若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置。

由上述步骤,可以清晰地了解到异常的反应包括着返回状态码表示访问失败和返回状态码表示当前状态与目标状态不一致,两种情况。如果出现两种情况中的任何一种表面此时监测的组件出现了异常故障,则立刻调用自定义事件SDK(Software DevelopmentKit,软件开发工具包)发送自定义事件告警至告警发送中心,告警发送中心的作用就是发送告警信息至对应的终端,及时的使对应的运维人员及时了解发现,从而进行及时的维修处理等操作,当然,此时发送的告警信息不只是简单的系统故障,而包括了具体的故障位置和故障类型,使得运维人员可以快速的针对该异常作出反应,减少故障时间。同时,针对不同类型的核心组件出现的异常信息,仅通过内置的SDK直接发送告警信息,不需要核心组件的汇总聚合操作,即使是核心组件异常,也不会影响告警信息的及时发送。而具体的事件告警发送中心发送告警信息至用户终端,可以以邮件或短信的方式发送告警信息至用户终端,使得对应的维修人员可以及时介入进行维修。当然,需指出的是,整个的过程包括了提前建立的数据库,数据库中包含了故障类型与返回状态码的对应关系,包括了对应的故障类型与对应的维修建议等。告警信息也可以包括着故障的时间以及故障的等级等,可以更好地使对应的运维人员进行及时的维修等。

进一步地,还可以包括,更新用户终端的地址信息,更新用户终端的地址信息可以保证在出现异常时,能够及时的将对应的故障异常信息发送至对应的运维人员,避免由于运维人员调岗等带来的维修不及时问题的发生,更好地服务于用户。

本实施例提供的一种容器化平台核心组件的检测及告警方法,包括:以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,根据健康监测访问的返回状态码,确定健康监测访问的结果,若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置,而上述的整体检测、告警链路流程完全不需要核心组件自身聚合并提供监控指标数据,自定义事件监控程序会基于各个核心组件对外提供的公开API接口进行检测访问,并且在检测到异常时基于不同类型的核心组件异常信息,通过内置SDK直接发送对应的自定义事件告警给事件告警发送中心,即使集群各组件异常对该自定义事件监控告警链路也没有任何影响,并且完全不依赖监控指标数据而仅基于访问的返回状态码以及检测访问是否成功来发送自定义事件告警,保证了即使核心组件出现故障,维修人员也能进行及时的维修,有效地减少对用户带来的业务损失。

基于同一总的发明构思,本实施例还保护一种容器化平台核心组件的检测及告警装置。

图2是本发明实施例提供的容器化平台核心组件的检测及告警装置的一种结构示意图;

如图2所示,本实施例的一种容器化平台核心组件的检测及告警装置,包括:

检测模块10,用于以预设时间频率对容器化平台集群内的所有组件进行健康监测访问;

确定模块20,用于根据健康监测访问的返回状态码,确定健康监测访问的结果;

告警模块30,用于若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置。

本实施例提供的一种容器化平台核心组件的检测及告警装置,包括:以预设时间频率对容器化平台集群内的所有组件进行健康监测访问,根据健康监测访问的返回状态码,确定健康监测访问的结果,若结果显示异常,则调用自定义事件SDK发送告警信息至事件告警发送中心,以使事件告警发送中心发送告警信息至用户终端,告警信息包括故障类型和故障位置,而上述的整体检测、告警链路流程完全不需要核心组件自身聚合并提供监控指标数据,自定义事件监控程序会基于各个核心组件对外提供的公开API接口进行检测访问,并且在检测到异常时基于不同类型的核心组件异常信息,通过内置SDK直接发送对应的自定义事件告警给事件告警发送中心,即使集群各组件异常对该自定义事件监控告警链路也没有任何影响,并且完全不依赖监控指标数据而仅基于访问的返回状态码以及检测访问是否成功来发送自定义事件告警,保证了即使核心组件出现故障,维修人员也能进行及时的维修,有效地减少对用户带来的业务损失。

进一步地,本实施例中的检测模块具体用于:

获取容器化平台集群内的所有组件的访问路径,访问路径为所有组件对外提供的API接口;

基于访问路径,通过自定义事件监控单元按照预设时间对容器化平台集群内的所有组件进行健康监测访问,预设时间为用户端自行设定的时间间隔。

进一步地,本实施例中的结果显示异常包括:返回状态码表示访问失败或返回状态码表示当前状态与目标状态不一致。

进一步地,本实施例中的告警模块具体用于:

事件告警发送中心以邮件或短信的方式发送告警信息至用户终端。

关于装置部分的实施例,在对应的方法实施例中已经做了详细的介绍说明,因此,在对应的装置部分不再进行具体的阐述,可以相互参照进行理解。

图3是本发明实施例提供的容器化平台核心组件的检测及告警设备的一种结构示意图。

如图3所示,本实施例还保护一种容器化平台核心组件的检测及告警设备,包括:处理器100,以及与处理器100相连接的存储器200;

存储器200用于存储计算机程序,计算机程序至少用于上述任一实施例的容器化平台核心组件的检测及告警方法;

处理器200用于调用并执行存储器100中的计算机程序。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号