首页> 中国专利> 一种用于数据中心的机房IT设备故障精准检测方法及系统

一种用于数据中心的机房IT设备故障精准检测方法及系统

摘要

本发明公开了一种用于数据中心的机房IT设备故障精准检测方法及系统,其方法包括:按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,对所述周期性能数据序列进行归一化处理,按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,根据每个预设故障类型对应的目标异常值分数判断目标IT设备是否出现故障以及具体故障信息。可智能地根据计算的分数确定目标IT设备是否出现故障以及当出现故障时的具体故障信息,无需人工逐个进行故障排查,快速准确地确定目标IT设备的具体故障,节省了人力成本的同时也可以快速地使维修人员进行后续维修。

著录项

  • 公开/公告号CN113176962A

    专利类型发明专利

  • 公开/公告日2021-07-27

    原文格式PDF

  • 申请/专利权人 北京中大科慧科技发展有限公司;

    申请/专利号CN202110400918.5

  • 发明设计人 赵希峰;

    申请日2021-04-14

  • 分类号G06F11/07(20060101);G06F16/906(20190101);

  • 代理机构11399 北京冠和权律师事务所;

  • 代理人吴金水

  • 地址 100094 北京市海淀区东北旺南路29号首农蓝海中心

  • 入库时间 2023-06-19 12:00:51

说明书

技术领域

本发明涉及设备管理技术领域,尤其涉及一种用于数据中心的机房IT设备故障精准检测方法及系统。

背景技术

随着信息化社会的高速发展,现代化信息技术和自动化设备呈现爆发式增长趋势,数据中心规模也持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,对其故障检测和排除变得至关重要。机房设备故障隐患主要在于机房内网络设备、存储设备和服务器等用电设备长时间通电工作、设备老化和人工误操作等造成的。这些情况导致的资产设备故障,如果不及时报警并指出机房运行中出现的异常情况,将导致信息数据存在安全隐患。

现有的及房IT设备故障检测方法为采集机房IT设备的工作参数,人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命。

发明内容

针对上述所显示出来的问题,本发明提供了一种用于数据中心的机房IT设备故障精准检测方法及系统用以解决背景技术中提到的人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命的问题。

一种用于数据中心的机房IT设备故障精准检测方法,包括以下步骤:

按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;

对所述周期性能数据序列进行归一化处理;

按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;

计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;

根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。

优选的,所述按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,包括:

确定所述目标IT设备的已使用时长;

根据所述已使用时长确定目标IT设备的性能检测周期,将所述性能检测周期确定为所述目标周期;

按照所述目标周期获取所述目标IT设备的工作参数;

将每个性能指标对应的目标工作参数相互结合;

结合完毕后,采集每个性能指标在不同维度下的子性能指标值;

根据每个性能指标在不同维度下的子性能指标值生成每个性能指标的性能数据子序列;

根据所有性能指标的性能数据子序列生成目标IT设备的周期性能数据序列。

优选的,所述对所述周期性能数据序列进行归一化处理,包括:对所述周期性能数据序列进行最大最小归一化处理。

优选的,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,包括:

确定与每个预设故障类型相关的目标性能指标;

在所述周期性能数据中获得所述目标性能指标对应的目标性能数据;

根据每个预设故障类型对应的目标性能数据将处理后的周期性能数据进行聚类,获得聚类结果。

优选的,所述计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,包括:

确定所述目标IT设备的工作机能水平值;

确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;

根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;

当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;

当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。

优选的,所述根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息,包括:

确认每个预设故障类型对应的目标异常值分数是否大于等于该预设故障类型对应的预设异常值分数,若是,确认所述目标IT设备无故障,否则,确认所述目标IT设备有故障;

确定目标异常值分数小于预设异常值分数的目标故障类型,根据所述目标故障类型与目标IT设备的性能指标信息确定目标IT设备的具体故障信息。

优选的,所述方法还包括:

根据所述目标IT设备的具体故障信息生成目标IT设备的故障代码;

查找与所述故障代码对应的故障点,对所述故障点进行定位,获取电子定位结果;

查询与所述故障点对应的故障解决方案;

将所述故障解决方案以及电子定位结果进行显示。

优选的,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果之后,还包括:

获取与所述聚类结果相关的目标业务操作,并获取所述目标业务操作相关的业务输入指令,并从设备数据库和管理数据库中调取与所述业务输入指令相关第一数据A

确定所述第一数据A

否则,确定所述第一数据A

同时,确定所述第二数据A

其中,i=1,2;

且根据第一归类处理结果S

一种用于数据中心的机房IT设备故障精准检测系统,该系统包括:

采集模块,用于按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;

处理模块,用于对所述周期性能数据序列进行归一化处理;

聚类模块,用于按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;

计算模块,用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;

判断模块,用于根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。

图1为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的工作流程图;

图2为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的另一工作流程图;

图3为本发明所提供的一种用于数据中心的机房IT设备故障精准检测方法的又一工作流程图;

图4为本发明所提供的一种用于数据中心的机房IT设备故障精准检测系统的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

随着信息化社会的高速发展,现代化信息技术和自动化设备呈现爆发式增长趋势,数据中心规模也持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,对其故障检测和排除变得至关重要。机房设备故障隐患主要在于机房内网络设备、存储设备和服务器等用电设备长时间通电工作、设备老化和人工误操作等造成的。这些情况导致的资产设备故障,如果不及时报警并指出机房运行中出现的异常情况,将导致信息数据存在安全隐患。

现有的及房IT设备故障检测方法为采集机房IT设备的工作参数,人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命。为了解决上述问题,本实施例公开了一种用于数据中心的机房IT设备故障精准检测方法。

一种用于数据中心的机房IT设备故障精准检测方法,如图1所示,包括以下步骤:

步骤S101、按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;

步骤S102、对所述周期性能数据序列进行归一化处理;

步骤S103、按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;

步骤S104、计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;

步骤S105、根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。

上述技术方案的工作原理为:按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,对所述周期性能数据序列进行归一化处理,按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。

上述技术方案的有益效果为:通过对周期性能数据序列进行聚类进而计算每个预设故障类型对应的目标异常值分数即可智能地根据计算的分数确定目标IT设备是否出现故障以及当出现故障时的具体故障信息,无需人工逐个进行故障排查,快速准确地确定目标IT设备的具体故障,节省了人力成本的同时也可以快速地使维修人员进行后续维修,提高了目标IT设备的使用寿命,解决了现有技术中人为地根据采集到的工作参数逐一进行故障排查,严重地浪费了人力成本的同时也大大地影响了后续的维修效率,进而造成机房设备的定期维护工作不到位而降低了设备的使用寿命的问题。

在一个实施例中,所述按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列,包括:

确定所述目标IT设备的已使用时长;

根据所述已使用时长确定目标IT设备的性能检测周期,将所述性能检测周期确定为所述目标周期;

按照所述目标周期获取所述目标IT设备的工作参数;

将每个性能指标对应的目标工作参数相互结合;

结合完毕后,采集每个性能指标在不同维度下的子性能指标值;

根据每个性能指标在不同维度下的子性能指标值生成每个性能指标的性能数据子序列;

根据所有性能指标的性能数据子序列生成目标IT设备的周期性能数据序列。

上述技术方案的有益效果为:使得目标IT设备的周期性能数据序列更加准确和实际,为后续故障判断流程提供数据保障,进一步地,通过智能设定检测周期可以根据目标IT设备的使用寿命灵活的确定检测周期的长短,进而可以实现频繁地对于目标IT设备的故障检测,进一步地挺高了目标IT设备的使用寿命。

在一个实施例中,所述对所述周期性能数据序列进行归一化处理,包括:对所述周期性能数据序列进行最大最小归一化处理。

在一个实施例中,如图2所示,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果,包括:

步骤S201、确定与每个预设故障类型相关的目标性能指标;

步骤S202、在所述周期性能数据中获得所述目标性能指标对应的目标性能数据;

步骤S203、根据每个预设故障类型对应的目标性能数据将处理后的周期性能数据进行聚类,获得聚类结果。

上述技术方案的有益效果为:通过对性能数据进行分类可以快速直观地确定每个预设故障类型在周期性能数据中对应的性能数据,使得分类过程更加简洁和方便。

在一个实施例中,所述计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数,包括:

确定所述目标IT设备的工作机能水平值;

确认所述工作机能水平值是否大于等于预设阈值,若是,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为100,否则,确认所述每个聚类结果中周期性能数据子序列的异常值分数的准确度为90;

根据每个预设故障类型对应的周期性能数据子序列的第一子序列值与目标IT设备在正常工作状态下的性能指标的第二子序列值进行除法计算以获得每个预设故障类型对应的周期性能数据子序列的第一异常值分数;

当确认所述准确度为100时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数确认为该聚类结果中周期性能数据子序列的目标异常值分数;

当确认所述准确度为90时,将所述每个预设故障类型对应的周期性能数据子序列的第一异常值分数乘以预设比例以获得每个预设故障类型对应的周期性能数据子序列的第二异常值分数,将每个预设故障类型对应的周期性能数据子序列的第二异常值分数确认为该预设故障类型对应的周期性能数据子序列的目标异常值分数。

上述技术方案的有益效果为:通过根据目标IT设备的工作机能水平值来对计算出的异常值分数进行调整可以在考虑到目标IT设备自身工作能力的情况下实际地评估出目标IT设备是否发生故障。

在一个实施例中,所述根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息,包括:

确认每个预设故障类型对应的目标异常值分数是否大于等于该预设故障类型对应的预设异常值分数,若是,确认所述目标IT设备无故障,否则,确认所述目标IT设备有故障;

确定目标异常值分数小于预设异常值分数的目标故障类型,根据所述目标故障类型与目标IT设备的性能指标信息确定目标IT设备的具体故障信息。

上述技术方案的有益效果为:通过直接利用分数比较的方式确定目标IT设备是否发生故障可以直观地根据评分确定目标IT设备是否发生故障,提高了判定的效率。

在一个实施例中,如图3所示,所述方法还包括:

步骤S301、根据所述目标IT设备的具体故障信息生成目标IT设备的故障代码;

步骤S302、查找与所述故障代码对应的故障点,对所述故障点进行定位,获取电子定位结果;

步骤S303、查询与所述故障点对应的故障解决方案;

步骤S304、将所述故障解决方案以及电子定位结果进行显示。

上述技术方案的有益效果为:使得维修人员可以快速精准地知晓目标IT设备发生故障的故障点以及具体的维修方案,进而可以快速地对目标IT设备进行维修以保证目标IT设备的工作效率以及服务质量,进一步地提高了用户的体验感。

在一个实施例中,所述按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果之后,还包括:

获取与所述聚类结果相关的目标业务操作,并获取所述目标业务操作相关的业务输入指令,并从设备数据库和管理数据库中调取与所述业务输入指令相关第一数据A

确定所述第一数据A

否则,确定所述第一数据A

同时,确定所述第二数据A

其中,i=1,2;

且根据第一归类处理结果S

上述技术方案的有益效果为:可以准确地确认聚类结果的分类是否为有效分类以及对于目标IT设备是否具有合理效应,进一步地,通过对目标IT设备的中的对应子部件进行有效或者无效反馈可以根据反馈结果精确地确定目标IT设备是否具备某种故障,从另一方面来实现对于目标IT设备的故障的判定,提高了故障判定的准确性。

本实施例还公开了一种用于数据中心的机房IT设备故障精准检测系统,如图4所示,该系统包括:

采集模块401,用于按照目标周期采集目标IT设备的性能指标信息,获得周期性能数据序列;

处理模块402,用于对所述周期性能数据序列进行归一化处理;

聚类模块403,用于按照预设故障类型对处理后的周期性能数据进行聚类,获得聚类结果;

计算模块404,用于计算聚类结果中每个预设故障类型对应的周期性能数据子序列的目标异常值分数;

判断模块405,用于根据每个预设故障类型对应的目标异常值分数判断所述目标IT设备是否出现故障以及当出现故障时的具体故障信息。

上述技术方案的工作原理及有益效果在方法权利要求中已经说明,此处不再赘述。

本领域技术人员应当理解的是,本发明中的第一、第二指的是不同应用阶段而已。

本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号