首页> 中国专利> 监控自动漂移的云服务器自动监控系统及方法

监控自动漂移的云服务器自动监控系统及方法

摘要

本发明涉及一种监控自动漂移的云服务器自动监控系统和方法,本发明所述的监控自动漂移的云服务器自动监控系统和方法,通过实时采集自身性能指标和其所在的物理服务器的性能指标,并在采集的所述监控节点自身性能或其所在的物理服务器的性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移。本发明的所述系统和方法在监控节点性能达到一定预设的瓶颈条件时自动进行漂移,在监控节点自身负载超载或是其所在物理服务器发生负载超载问题前实现分流处理,避免因监控节点的负载过重对被监控的云服务性能造成的影响或是监控服务的中断,保证监控业务处理的连续性。

著录项

  • 公开/公告号CN103338240A

    专利类型发明专利

  • 公开/公告日2013-10-02

    原文格式PDF

  • 申请/专利权人 中金数据系统有限公司;

    申请/专利号CN201310243613.3

  • 发明设计人 殷磊;邹均;

    申请日2013-06-19

  • 分类号H04L29/08(20060101);H04L12/24(20060101);

  • 代理机构11250 北京三聚阳光知识产权代理有限公司;

  • 代理人寇海侠

  • 地址 100176 北京市大兴区北京经济技术开发区博兴八路1号

  • 入库时间 2024-02-19 20:25:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-03

    专利权的转移 IPC(主分类):H04L29/08 登记生效日:20170411 变更前: 变更后:

    专利申请权、专利权的转移

  • 2016-07-06

    授权

    授权

  • 2013-11-06

    实质审查的生效 IPC(主分类):H04L29/08 申请日:20130619

    实质审查的生效

  • 2013-10-02

    公开

    公开

说明书

技术领域

本发明涉及云计算领域监控领域,具体是一种监控自动漂移的云服务器自动监控系统及方法。

背景技术

云计算基础设施平台是一个复杂的计算服务平台,具有多样化、异构性和动态变化的特点。为保障云计算系统及服务的正常运行,云监控系统成为其必不可少的组成部分及保障,云监控系统能够实时反映出云平台的健康状况,并能够及时处理云计算平台已发生的问题和发现云计算平台潜在的问题,这对于管理和调度云计算系统起到了关键性的作用。因此,一个好的云监控系统对于云计算系统的正常运行及维护起着决定性的作用。目前,对于云监控系统的好坏并没有明确的规定,且目前的云监控系统大部分通过手工方式进行部署配置,少部分具备自动化监控的云监控系统也都是采用主从备份方式,即在主监控服务器发生故障时,由从监控服务器代替其工作,在计算服务高峰期主服务器和从服务器会担负相同性能压力,使整个系统宕机,且缺乏提前进行预防的主动性,因而无法保证监控业务的连续性。

中国专利文献CN102882909A公开了一种云计算服务监控系统,用于对包含有云服务节点的云计算系统进行监控,包括至少一个云管理节点、多个监测节点、至少一个主监控节点,其中监测节点根据从主监控节点所接收到的监控命令对云计算的服务系统中的云服务节点进行监测,并将监测结果返回给主监控节点,主监控节点用于向检测节点发送监控命令,收集各个监测节点所返回的监测结果,并展示给管理员,云管理节点用于提供管理功能,所述管理功能包括:创建或删除所述云服务节点、主监控节点、检测节点;动态调整所述云服务节点的配置。上述专利文献中公开的云计算服务监控系统,是在服务器已经宕机时才进行处理,采用的是主节点发生故障时,使用从节点代替主节点,在实际的业务应用中,主从节点是同步的,如是因为检测任务引起的性能而宕机的情况,有可能主从都同时宕机,此时是无法用从节点代替主节点的,进而影响整个云计算业务的连续性。且上述专利文献中创建监控节点是没有策略的,对云计算系统的各个节点不做任何区分,这样会使一些重要的核心业务系统受到影响,导致监控业务和核心业务的同时中断。 

 

发明内容

本发明所要解决的技术问题是现有技术中云计算服务监控系统,采用的是主节点发生故障时,使用从节点代替主节点,监控数据更新滞后从而引起云服务监控中断,致使业务中断的技术问题,从而提供一种监控自动漂移的云服务器自动监控系统及方法。

为解决上述技术问题,本发明是通过以下技术方案实现的:

一种监控自动漂移的云服务器自动监控系统,包括:

云主机平台,包括若干台云主机,每个所述云主机运行在若干台物理主机上,其中,物理主机之间通过交换机相连,若干台物理主机组成一个物理节点;

至少一个管理虚拟机,一个所述虚拟管理机运行在一个云主机中,所述虚拟管理机进一步包括:

云主机信息采集器,用于采集创建或销毁的云主机信息,并将采集到的云主机信息发送给云资源管理平台;

云资源管理平台,接收并保存所述云主机信息采集器发送的所述云主机信息,同时将所述云主机信息发送给监控调度服务器;

监控调度服务器,接收所述云资源管理平台发送的所述云主机信息,并根据漂移策略将新创建的云主机交由相应的监控节点进行监测和将运行所述管理虚拟机的云主机漂移,并根据监控节点返回的信息进行策略判断;同时,记录云主机和监控节点之间的对应关系;

监控节点,用于实时采集自身性能和所述监控节点所在的物理服务器的性能指标,并在采集的所述监控节点自身性能或所述监控节点所在的物理服务器的性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移;。

所述监控节点,进一步包括:

监控采集器,用于采集所述监控节点自身性能和所述监控节点所在的物理服务器的性能指标并发送给分析引擎;

策略库,预置策略模板,存储有预定义的漂移条件及漂移策略;

分析引擎,所述分析引擎接收所述监控采集器发送的所述监控节点自身性能和所述监控节点所在的物理服务器的性能指标息,当所述监控节点自身性能或所述监控节点所在的物理服务器的性能指标达到所述策略库预置的漂移条件时,调用所述监控节点的漂移策略,对所述监控节点进行漂移。

所述漂移策略包括:

首选策略:给每一台云主机指定漂移时首先漂移的物理节点;

非选择策略:指定若干个物理节点不能用于在漂移时创建新的云主机;

反相关联策略:指定漂移时物理节点的选取不是已经部署了相似云主机的物理节点。

所述物理主机被根据其工作内容划分为若干个物理区域,所述物理区域至少包括核心系统区域和一般生产区域;并且,所述非选择策略指定所述核心工作区域不用于在漂移时创建新的云主机。

所述监控调度服务器包括调度数据库,所述调度数据库用于记录在云主机创建或管理虚拟机进行漂移时创建出来的云主机信息;其中,所述云主机信息包括:云主机被监控时监控节点的唯一ID、监控节点使用的IP、监控节点使用的模板和监控节点已监控的云主机数量。

所述管理虚拟机提供API接口,并利用所述管理虚拟机提供的模板创建所述云主机,并在云主机创建完成后将云主机信息发送给云资源管理平台。

所述监控调度服务器记录了每个监控节点监控的云主机信息,所述监控调动服务器接收所述云主机信息,并按照所述调度数据库中的所述漂移策略中的策略分发监控任务。

所述监控节点还包括用于自动添加监控命令和监控任务的对外API接口的监控软件。

所述云资源管理平台还包括对所述云主机平台进行操作的API接口以及赋予调用API接口的用户以不同权限的赋值单元。

所述云主机平台进一步包括,生产云主机区域及监控云主机区域,其中,所述生产云主机区域负责对云数据进行处理;所述管理虚拟机运行在所述监控云主机区域。

还应包括一个云门户,所述云门户与所述云资源管理平台提供的API接口互联。

同时,提供一种监控自动漂移的云服务器自动监控方法,包括如下步骤:

S1:采集创建或销毁的云主机信息并保存;

S2:根据采集的创建或销毁的所述云主机信息,并根据漂移策略将新创建的云主机交由相应的监控节点进行监测,并根据监控节点返回的信息进行策略判断;同时,记录云主机和监控节点之间的对应关系;

S3: 监控节点实时采集自身性能和所述监控节点所在的物理服务器的性能指标,并在采集的所述监控节点自身性能或所述监控节点所在的物理服务器的性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移。

本发明的上述技术方案相比现有技术具有以下优点:

(1)本发明所述的监控自动漂移的云服务器自动监控系统和方法,通过实时采集自身性能和被监测的云主机性能指标和所述监控节点所在物理服务器性能指标,并在采集的所述监控节点自身性能和/或所述监控节点所在物理服务器性能指标达到预设漂移条件时,根据所述监控调度服务器的命令对所述监控节点进行漂移。本发明的所述系统和方法在监控节点性能达到一定预设的瓶颈条件时自动进行漂移,在监控节点负载超载前实现分流处理,避免监控服务和/或被监测的云主机因超载而中断,保证监控服务处理和业务的连续性。有效避免了现有技术中在主节点发生性能故障时使用从节点代替主节点,监控数据更新滞后引起的监控中断,或是云服务性能受监控负载影响的问题。

(2)本发明所述的监控自动漂移的云服务器自动监控系统和方法,采用策略模块进行策略控制,同时对核心业务和一般业务进行区分,在漂移时避开核心业务物理节点,保证不影响核心业务的正常运转,保证核心业务的连续性。

(3)本发明所述的监控自动漂移的云服务器自动监控系统和方法,云资源管理平台还包括对所述云主机平台进行操作的API接口以及赋予调用API接口的用户以不同权限的赋值单元,使监控信息根据不同人具有不同权限,可实现分租户和多级管理的功能,进而实现SAAS模式。

附图说明

为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明,其中,

图1是本发明一个实施例的监控自动漂移的云服务器自动监控系统的管理虚拟机的结构框图;

图2是本发明一个实施例的监控自动漂移的云服务器自动监控系统的监控节点的结构框图;

图3是本发明一个实施例的监控自动漂移的云服务器自动监控方法的方法流程图;

图4是本发明的一个实施例的云主机漂移示意图。

具体实施方式

实施例一:

作为本发明实施例一的一种监控自动漂移的云服务器自动监控系统,包括:云主机平台,所述云主机平台包括若干台云主机,每个所述云主机运行在若干台物理主机上,其中,物理主机之间通过交换机相连,若干台物理主机组成一个物理节点;每个所述云主机是所述云服务器完成预定监控工作或业务工作的虚拟主机,其中,用于完成监控工作的虚拟主机称为管理虚拟机,所述管理虚拟机至少有一个;如图1所示,一个所述管理虚拟机,运行在一个云主机中,所述管理虚拟机进一步包括,云主机信息采集器,用于采集创建或销毁的云主机信息,并将采集的所述云主机信息发送给云资源管理平台;云资源管理平台,接收并保存所述管理虚拟机发送的所述云主机信息,同时将所述云主机信息发送给监控调度服务器; 监控调度服务器,接收所述云资源管理平台发送的所述云主机信息,并根据监控策略将新创建的云主机交由相应的监控节点进行监测,并根据监控节点返回的信息进行策略判断;同时,记录云主机和监控节点之间的对应关系;监控节点,包含有监控软件,用于实时采集自身性能和所述监控节点所在物理服务器性能指标,并在采集的所述监控节点自身性能或所述监控节点所在物理服务器性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移;其中,所述监控节点的漂移是指所述监控节点所在的管理虚拟机对应的物理主机的漂移,即从负载大的物理主机漂移到负载小的物理主机;;参见图4所示,所述漂移指对所述监控节点或所述云主机所在的物理主机(即物理服务器)进行的迁移,即当监控节点监控数量超过负荷时在新物理服务器上创建新的监控主机,保证监控工作的连续性。

实施例二:

如图2所示,在实施例一的基础上,所述监控节点进一步包含:监控采集器,用于采集所述监控节点自身性能和被监测的云主机性能指标和所述监控节点所在物理服务器性能指标并发送给分析引擎;策略库,预置策略模板,存储有预定义的漂移条件及漂移策略;分析引擎,接收所述监控采集器发送的所述监控节点自身性能和所述监控节点所在物理服务器性能指标,当自身性能或所述监控节点所在物理服务器性能指标达到所述策略库预置的漂移条件时,调用所述监控节点的漂移策略,对所述监控节点进行漂移。作为一种具体实施例,所述漂移策略包括首选策略、非选择策略和反相关联策略,其中,所述首选策略的内容是给每一台云主机指定漂移时首先漂移的物理节点;所述非选择策略:指定若干个物理节点不能用于在漂移时创建新的云主机;所述反相关联策略:指定漂移时物理节点的选取不是已经部署了相似云主机的物理节点。相应地,所述云主机平台由若干个物理主机构建而成,所述物理主机被根据其工作内容划分为若干个物理区域,所述物理区域至少包括核心系统区域和一般生产区域;并且,所述非选择策略制定所述核心工作区域不用于在漂移时创建新的云主机。

作为本发明的其他实施例,在上述实施例的基础上,所述监控调度服务器包括调度数据库,所述调度数据库用于记录在云主机创建或管理虚拟机进行漂移时创建出来的云主机或漂移的监控系统所在云主机信息;其中,所述云主机信息包括:云主机被监控时监控主机的唯一ID、监控主机使用的IP、监控主机使用的模板和监控主机已监控的数量。

发明所述的监控自动漂移的云服务器自动监控系统和方法,通过实时采集自身性能和被监测的云主机性能指标和所述监控节点所在物理服务器性能指标,并在采集的所述监控节点自身性能或所述监控节点所在物理服务器性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移。本发明的所述系统和方法在监控节点性能达到一定预设的瓶颈条件时自动进行漂移,在监控节点性能受严重影响前实现分流处理,避免监控节点的监控业务中断,保证监控业务处理的连续性。有效避免了现有技术中在主节点发生故障时使用从节点代替主节点,监控数据更新滞后从而引起云服务监控中断,同时应监控开销影响云服务性能的问题。

本发明所述的监控自动漂移的云服务器自动监控系统和方法,采用策略模块进行策略控制,同时对核心业务和一般业务进行区分,在漂移时避开核心业务物理节点,保证不影响核心业务的正常运转,保证核心业务的连续性。

作为本发明的其他实施例,在上述实施例的基础上,所述管理虚拟机提供API(英文全称为ApplicationProgrammingInterface,意思为应用程序编程接口)接口,并利用所述管理虚拟机提供的模板创建所述云主机,并在云主机创建完成后将云主机信息发送给云资源管理平台。

作为本发明的其他实施例,在上述实施例的基础上,所述监控调度服务器记录了每个监控节点监控的云主机信息,所述监控调动服务器接收所述云主机信息,并按照所述调度数据库中的所述漂移策略中的策略分发监控任务。

作为本发明的其他实施例,在上述实施例的基础上,所述监控节点还包括用于自动添加监控命令和监控任务的对外API接口的监控软件。

作为本发明的其他实施例,在上述实施例的基础上,所述云资源管理平台还包括对所述云主机平台进行操作的API接口以及赋予调用API接口的用户以不同权限的赋值单元。

作为本发明的其他实施例,在上述实施例的基础上,还应包括一个云门户,所述云门户与所述云资源管理平台提供的API接口互联。

本发明所述的监控自动漂移的云服务器自动监控系统和方法,云资源管理平台还包括对所述云主机平台进行操作的API接口以及赋予调用API接口的用户以不同权限的赋值单元,使监控信息根据不同人具有不同权限,可实现分租户和多级管理的功能,进而实现SAAS(英文全称为Software-as-a-service,意思为软件运营服务模式,简称为软营模式)模式。

作为本发明的其他实施例,在上述实施例的基础上,所述云主机平台进一步包括,生产云主机区域及监控云主机区域,其中,所述生产云主机区域负责对云数据进行处理;所述管理虚拟机运行在所述监控云主机区域。

实施例三:

如图3所示,作为本发明一个实施例的一种监控自动漂移的云服务器自动监控方法,包括:

S1:采集创建或销毁的云主机信息并保存;

S2:根据采集的所述创建或销毁的云主机信息,并根据漂移策略将新创建的云主机交由相应的监控节点进行监测,并根据监控节点返回的信息进行策略判断;同时,记录云主机和监控节点之间的对应关系;

S3: 监控节点实时采集自身性能和所述监控节点所在物理服务器性能指标,并在采集的所述监控节点自身性能或所述监控节点所在物理服务器性能指标达到预设漂移条件时决定漂移,并由所述监控调度服务器执行对所述监控节点的漂移。       

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号