公开/公告号CN102340415A
专利类型发明专利
公开/公告日2012-02-01
原文格式PDF
申请/专利权人 北京新媒传信科技有限公司;
申请/专利号CN201110170620.6
申请日2011-06-23
分类号H04L12/24(20060101);H04L29/06(20060101);
代理机构11323 北京市隆安律师事务所;
代理人权鲜枝
地址 100089 北京市海淀区万泉庄路28号万柳新贵大厦A座5层
入库时间 2023-12-18 04:30:08
法律状态公告日
法律状态信息
法律状态
2014-04-16
授权
授权
2012-03-28
实质审查的生效 IPC(主分类):H04L12/24 申请日:20110623
实质审查的生效
2012-02-01
公开
公开
技术领域
本发明涉及服务器集群技术领域,特别是涉及一种服务器集群系统的监控方法和一种服务器集群系统。
背景技术
随着互联网应用和企业应用的不断扩大,需要大规模的服务器集群系统来部署的各种应用业务。
随着业务规模的增大,部分互联网应用和企业应用都会遇到系统规模变得日益庞大的问题,且系统规模增大后,对每台服务器上运行的服务的监控变得非常复杂和不可控。
因此,迫切需要一种有效的服务器集群的监控方案。
发明内容
本发明提供了一种服务器集群系统的监控方法,该方法能够实现对服务器集群系统中的所有服务器进行监控,并且实现简单、易于控制。
本发明还提供了一种服务器集群系统,该系统能够实现对所有服务器进行监控,并且实现简单、易于控制。
为达到上述目的,本发明的技术方案是这样实现的:
本发明公开了一种服务器集群系统的监控方法,该方法包括:
在服务器集群系统中的每台服务器上配置一个监控代理实例和一个对应的数据库实例;
在服务器集群系统中配置一台全局配置服务器,该全局配置服务器上保存有不同监控策略;
每台服务器上的监控代理实例从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据通过对应的数据库实例保存到本服务器中;
每台服务器上的监控代理实例根据监控策略和监控结果数据进行报警处理。
本发明还公开了一种服务器集群系统,该服务器集群系统包括:由多个服务器组成的服务器集群和一个全局配置服务器,其中,服务器集群中的每个服务器包括:一个监控代理模块和一个对应的数据库模块;
全局配置服务器,用于保存不同监控策略;
每个服务器中的监控代理模块,用于从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据保存到数据库模块中;
每个服务器中的监控代理模块,用于根据监控策略和监控结果数据进行报警处理。
由上述可见,本发明这种在服务器集群系统中的每台服务器上配置一个监控代理实例和一个对应的数据库实例;在服务器集群系统中配置一台全局配置服务器,该全局配置服务器上保存有不同监控策略;每台服务器上的监控代理实例从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据通过对应的数据库实例保存到本服务器中;每台服务器上的监控代理实例根据监控策略和监控结果数据进行报警处理的技术方案,能够实现对服务器集群系统中的所有服务器进行监控,并且实现简单、易于控制。
附图说明
图1是本发明实施例中的一种服务器集群系统的监控方法的流程图;
图2是本发明实施例中的集群服务器系统的示意图;
图3是本发明实施例中的应用服务器的结构示意图;
图4是本发明实施例中的数据库服务器的结构示意图;
图5是本发明实施例中的一种服务器集群系统的组成结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1是本发明实施例中的一种服务器集群系统的监控方法的流程图。如图1所示,该方法包括:
101,在服务器集群系统中的每台服务器上配置一个监控代理实例和一个对应的数据库实例。
102,在服务器集群系统中配置一台全局配置服务器,该全局配置服务器上保存有不同监控策略。
103,每台服务器上的监控代理实例从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据通过对应的数据库实例保存到本服务器中。
104,每台服务器上的监控代理实例根据监控策略和监控结果数据进行报警处理。
图1所示的技术方案,能实现对应用服务器集群中所有服务器的系统运行情况和系统健康状况的评估和监控,并可在可配置的异常状态下进行服务报警。
图2是本发明实施例中的集群服务器系统的示意图。如图2所示,该系统包括服务器集群和一个全局配置服务器,此外还包括一个监控机实例,该监控机实例可以单独运行在一台机器上,也可以运行在某台已有的服务器上。服务器集群中的每台服务器上都安装了一个监控代理实例和一个数据库实例。
在图2中,全局配置服务器上保存有不同监控策略,监控代理实例从全局配置服务器获取对应于本服务器的监控策略对本服务器进行监控,并将监控结果数据保存到数据库实例中,并根据监控策略和监控结果数据进行报警处理。
监控代理实例提供全部的监控和报警信息提交,是整个系统中的数据来源和数据分发器,负责执行监控策略,提交监控数据。每台服务器上的监控代理实例,将监控结果数据上传给监控机实例;或者,监控机实例从每台服务器上的监控代理实例或数据库实例主动获取监控结果数据。
在图2中,服务器集群系统中的服务器包括:应用服务器和数据库服务器;则所述根据所获取的监控策略对本服务器进行监控包括:应用服务器上的监控代理实例根据所获取的监控策略对本服务器上的各个应用进行监控;数据库服务器的监控代理实例根据所获取的监控策略对本服务器上的各个数据库进行监控。
图3是本发明实施例中的应用服务器的结构示意图。如图3所示,监控代理实例和数据库实例以及客户端应用共存于一台服务器上。
图4是本发明实施例中的数据库服务器的结构示意图。如图4所示,监控代理实例和对应的数据库实例以及原有的数据库共存于一台服务器上。这里为了区分原有的数据库和新配置的数据库实例,将新配置的数据库实例称为与监控代理实例对应的数据库实例。
在全局配置服务器上保存的不同的监控策略以键值标识作为区分,即不同的监控策略用不同的键值标识。每种监控策略可由配置表和部署表表示。其中配置表如表1所示,部署表如表2所示。
表1
可见,配置表包括如下字段:键值标识、脚本、显示名称、输出顺序、版本号。
表2
可见,部署表包括如下字段:标识、键值标识、服务器名、进程名称或端口号、上传标志、上传粒度、阀值区间最小值、阀值区间最大值、报警机制、报警后动作、版本号。
在本发明中,对于表2所示的配置表,可以实现泛化的配置也可以实现专一的配置,具体如表3所示:
表3
表3中标识1和2中信息分别表示:
1.所有机器(服务器)中的3306端口的性能检测数据(50201表示到达mysql的连接数)都使用第1条配置
a)不上传性能数据
b)采集频率是60秒
c)最小连接数是10,低于10会调用Script中的脚本(比如网络设备出现了问题,连接数掉到0)
d)最大连接数是1000,高于1000会调用Script中的脚本。
2.服务器DB-01中的3307端口将采用第二条设置,如果DB-01中有3306和3307两个MyS QL数据库实例,那么3306将采用第一条配置,3307将采用第二条配置。详细解释如下:
a)上传性能数据
b)采集频率是60秒
c)最小连接数是10
d)最大连接数是2000。
可见,部署表中的服务器名称用通配符号(*)表示时,表示所有的服务器。
在本发明中,根据所获取的监控策略对服务器进行监控包括:采集本服务器的CPU指标、内存指标、磁盘指标、网卡流量指标、MySQL指标。
在本发明的实施例中,单机运行监控指标及其键值标识(KeyID)的配置下列各表所示。
CPU监控指标如表4所示:
表4
内存监控指标如表5所示:
表5
磁盘监控指标如表6所示:
表6
网卡流量监控指标如表7所示:
表7
MySQL监控指标如表8所示:
表8
在本发明的一个实施例中,监控机实例可以实时地从每台服务器上的监控代理实例获取实时数据并回执二维图表,也可以从每台服务器上数据库实例获取历史数据绘制二维图表。
每台服务器上的监控代理实例或者对应的数据库实例定期删除保存到本服务器上的监控结果数据。例如通过一个7天的轮换机制,自动删除掉过期的数据。
基于上述实施例给出本发明中的一种服务器集群系统的具体组成结构。
图5是本发明实施例中的一种服务器集群系统的组成结构图。如图5所示,该服务器集群系统包括:由多个服务器组成的服务器集群和一个全局配置服务器,其中,服务器集群中的每个服务器包括:一个监控代理模块和一个对应的数据库模块;
全局配置服务器,用于保存不同监控策略;
每个服务器中的监控代理模块,用于从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据保存到数据库模块中;
每个服务器中的监控代理模块,用于根据监控策略和监控结果数据进行报警处理。
如图5所示,该集群服务器系统还进一步包括:一个监控机;
每个服务器中的监控代理模块,进一步用于将监控结果数据上传给监控机;
或者,
监控机,用于从每台服务器中的监控代理模块获取监控结果数据,或者从每台服务器中的与监控代理模块对应的数据库模块获取监控结果数据。
在图5所示的服务器集群系统中,所述全局配置服务器上保存的不同的监控策略以键值标识作为区分;
每种监控策略包括配置表和部署表;其中,配置表包括如下字段:键值标识、脚本、显示名称、输出顺序、版本号;部署表包括如下字段:标识、键值标识、服务器名、进程名称或端口号、上传标志、上传粒度、阀值区间最小值、阀值区间最大值、报警机制、报警后动作、版本号;
其中,所述部署表中的服务器名称用通配符号表示时,表示所有的服务器。
综上所述,本发明这种在服务器集群系统中的每台服务器上配置一个监控代理实例和一个对应的数据库实例;在服务器集群系统中配置一台全局配置服务器,该全局配置服务器上保存有不同监控策略;每台服务器上的监控代理实例从全局配置服务器获取对应于本服务器的监控策略,根据所获取的监控策略对本服务器进行监控,并将监控结果数据通过对应的数据库实例保存到本服务器中;每台服务器上的监控代理实例根据监控策略和监控结果数据进行报警处理的技术方案,能够实现对服务器集群系统中的所有服务器进行监控,并且实现简单、易于控制。此外,本发明中还给出了实现脚本系统、计数输出等功能的方案,进一步完善了这种监控方案。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
机译: 服务器集群监控方法及系统
机译: 一种具有近场通信能力的安全传感器控制与集成监控方法,提供一种访问传感器数据的API及其系统
机译: 一种基于事务的系统监控方法和系统