首页> 中国专利> 一种统一管理多业务系统的实时监控报警系统和方法

一种统一管理多业务系统的实时监控报警系统和方法

摘要

本发明涉及一种统一管理多业务系统的实时监控报警系统和方法,尤其涉及一种针对不同类型、不同地方的业务端进行统一管理的实时监控报警系统及其方法。解决现有技术中一个单位或多个单位的各个业务系统单独维护所带来的维护信息分散、维护成本高的问题。利用主控系统和灾备系统组成的配置一一样的报警装置,主控系统、灾备系统通过各自的交换机利用专用网络连接在一起,主控系统、灾备系统由安装在主控系统中的第一灾备模块、灾备系统中的第二灾备模块控制,灾备系统对系统自身的故障进行自检。利用此装置和监控方法,实现了多样化、分散化的信息系统得以在一个监控报警系统中并存,节省用户工作量,保证系统的安全运行。

著录项

  • 公开/公告号CN101631040A

    专利类型发明专利

  • 公开/公告日2010-01-20

    原文格式PDF

  • 申请/专利号CN200910091057.6

  • 申请日2009-08-24

  • 分类号H04L12/24;H04L12/26;

  • 代理机构北京安博达知识产权代理有限公司;

  • 代理人徐国文

  • 地址 100029 北京市朝阳区裕民路甲3号

  • 入库时间 2023-12-17 23:22:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-10-28

    未缴年费专利权终止 IPC(主分类):H04L12/24 授权公告日:20110817 终止日期:20140824 申请日:20090824

    专利权的终止

  • 2011-08-17

    授权

    授权

  • 2010-03-24

    实质审查的生效

    实质审查的生效

  • 2010-01-20

    公开

    公开

说明书

技术领域

本发明涉及一种多业务实时监控报警系统,尤其涉及一种针对不同类型、不同地方的业务端进行统一管理的实时监控报警系统及其方法。

背景技术

随着信息化的日益深入,信息系统已经成为支撑各行业运行必不可少的基础设施,信息系统在运行过程中产生的各类监控报警信息对用户和管理人员及时发现定位系统异常,挖掘系统运行规律,将起到至关重要的作用,所以有必要对这些监控报警信息进行实时的接收、分析和处理,但传统的监控报警手段,都是采用各业务系统提供独立的监控界面,然后由管理人员定时进行查询和维护,对于重要的业务系统,更需要确保24小时的监管,这样的运行维护模式一方面不利于及时发现和定位运行异常,另一方面,监控报警信息的分散处理也不利于对其进行关联分析和深入挖掘,特别是随着不同单位各种业务系统的逐渐增多,维护成本也逐年增加,这不仅仅意味着维护人员的人力成本日益增长,同时由于每个业务系统的维护都是独立的,维护复杂度也同步增加。因而有必要提供集中的、统一的业务实时监控报警系统。

发明内容

为解决现有技术中一个单位或多个单位的各个业务系统单独维护所带来的维护信息分散、维护成本高的问题,本发明提供一种对不同地方、不同单位或同一单位的多个相同或不相同业务系统进行统一管理的监控报警系统和运行方法,本发明的技术方案如下:一种统一管理多业务系统的监控报警系统,包括报警接收装置、报警处理装置、短信发送装置、数据库、呈现装置、用户平台和邮件发送装置,所述各个装置通过交换机连接在一起,其特征在于,所述监控报警系统分为主控系统和灾备系统,且每套系统配置一样,所述业务端分别与主控系统、灾备系统的报警接收装置连接,所述主控系统、灾备系统通过各自的交换机利用专用网络连接在一起,所述主控系统、灾备系统由安装在主控系统中的第一灾备模块、灾备系统中的第二灾备模块控制,所述每个灾备模块分别包括状态监控子模块和控制子模块,

所述业务端为各个不同类型或相同类型的业务系统,所述业务系统分布在同一单位或不同单位;

所述报警接收装置包括接收信息识别、注册信息识别、报警信息处理:

所述接收信息识别包括识别报警信息结构、通信协议和对发送方式的认证;

所述注册信息识别包括登记业务端合法性判断、注册码识别;

所述报警信息处理包括报警对象、报警原因、报警时间、报警等级、报警内容的处理;

所述用户平台包括普通用户输入平台、匿名用户输入平台、管理员输入平台;

所述普通用户输入平台为用户提供对其业务端管理方式、报警方式、处理方式的修改、查询及定义。

所述匿名用户输入平台,为非注册用户提供一个基本功能的运行平台;

所述管理员输入平台,为高级用户提供一个完全开放的自设定运行平台;

所述第一灾备模块、第二灾备模块之间利用获取的对方心跳信息来判断是否异常,所述第一灾备模块、第二灾备模块通过监控子模块、控制子模块在对方系统出现问题时能够进行接管控制并对问题系统进行修复;

所述主控系统、灾备系统的数据库能够识别读取操作和写入操作;读取操作能够同时对主控系统、灾备系统的数据库进行操作,写入操作时只能对主控系统的数据库进行操作,写入数据由灾备模块自动备份到灾备系统的数据库,使用中的数据库发生问题,灾备模块自动启动备用数据库并对问题数据库进行修复。

本发明报警装置的监控方法:

A、所述报警接收装置接收各个业务端的报警信息;

(1)首先对接收到的报警信息进行信息来源确认;

(2)对认可的信息传给报警处理装置进行处理;

B、报警处理装置按事先定义的标准将接收到的信息通过交换机发送到短信发送装置、呈现装置、邮件发送装置。

本发明监控方法的另一优选方式:所述A步骤(1)中对信息来源确认包括:

(1)按系统定义的接口标准认证报警信息结构、通信协议、信息发送方式;

(2)判断业务端合法性;

(3)业务端标识码识别。

本发明监控方法的又一优选方式,所述A步骤(2)中信息处理包括:

(1)对认可信息进行报警对象、报警原因、报警事件、报警等级、报警内容信息分类;

(2)将分类后的信息放入报警事件缓冲队列中;

(3)按报警等级、时间优先从报警事件缓冲队列中提取报警事件信息进行处理。

本发明监控方法的还一优选方法,所述(1)步骤中信息分类包括如下步骤:

(1)将信息分成报警事件和恢复事件;

(2)按业务端设定的报警编码号查询新接收报警事件是否接收过,按结果做相应处理;

(3)按业务端设定的报警编码号查询是否有恢复事件对应的报警事件,按结果做相应处理。

本发明监控方法的再一优选方式,所述(2)中还包括如下步骤:

(1)将新报警信息及报警恢复信息存入数据库;

(2)删除数据库中已恢复但还在发送队列的报警信息。

本发明监控方法的还一优选方式,所述B步骤事先定义包括如下执行策略:

(1)系统预定义的报警发送策略,包含但不限于报警级别、发送方式;

(2)用户自定义的报警发送策略,包含但不限于报警级别、发送方式。

本发明监控方法的再一优选方式,还包括报警监控系统故障恢复步骤,当主控系统或灾备系统出现故障时:

(1)灾备控制模块修改报警引擎、用户平台数据库连接配置文件,并暂停问题装置的工作,控制灾备系统的相关装置提供服务;

(2)修复问题装置,修改报警引擎、用户平台数据库连接配置文件,启用修复后的装置。

本技术方案使得现有多样化、分散化的信息系统得以在一个监控报警系统中并存,与现有技术相比,本技术方案的实时监控报警系统及运行方法不仅为各个业务系统的报警提供了统一的报警接口,并且为维护人员提供了定制报警策略的方法和丰富的报警呈现方式,本系统可以将维护人员管理的多个业务系统报警进行汇总,维护人员只需要在一个页面就能够查看所有业务系统的报警状态,节省用户工作量;本技术方案利用双系统同时工作,保证了报警业务的正常进行,利用灾备模块对系统进行自检、备份,各种报警方式可以由用户自行定义,可以对不同需求的用户提供不同的使用平台。

附图说明

图1本发明报警监控系统示意图

图2本发明报警监控方法流程框图

图3本发明报警监控系统灾备模块自检流程框图

具体实施方式

为实现多业务端的统一管理和监控报警,本发明采用规定的统一数据接入接口,规定接口的数据长度、使用协议和发送方式,并对每一个注册业务端发放一个唯一注册码,使每个不同的业务端遵循此统一的标准,为进一步统一管理提供了基础,使用本系统的用户可以是注册用户、匿名用户及管理员用户,针对每一种用户都分别有不同的使用级别和操作自由度。

如图1所示,本发明包括两套监控系统,分别为主控系统和灾备系统,每套系统都分别由报警接收装置、报警处理装置、交换机、短信发送装置、数据库、呈现装置、用户操作/输入平台和邮件发送装置组成,各个装置通过交换机连接在一起,分布在不同单位或同一单位的不同业务信息系统与监控系统的报警接收装置连接。主控系统与灾备系统的交换机通过专用网络连接在一起,以实现实时操作和控制,且安全性高。两个系统的数据库采用同步触发的方式,一旦某个数据库进行了改动,另一个数据库会进行同步更新。主控系统与灾备系统的报警接收装置同时对外服务,各个业务端(业务系统1、业务系统2、业务系统a1、业务系统a2、……、业务系统n、业务系统an)可以选择任意的报警接收装置进行报警事件发送,例如业务系统1向主控系统的报警接收装置发送报警事件、业务系统a1向灾备系统的报警接收发送报警事件,如果其中一个系统的报警接收装置出现故障,业务端能够选择另外一个系统进行报警事件发送,为了平衡监控系统的负载,在初始时按照一定策略(例如属地策略)设定业务系统优先连接的报警接收。

主控系统与灾备系统分别安装有灾备模块,灾备模块利用状态监控模块和控制模块对每个系统进行控制、检测,以及两个系统之间的状态监控、数据传输。报警接收装置通过对收到的各种信息进行报警信息结构、使用协议的识别和发送方式认证、业务端合法性判断、注册码识别,并对报警对象、报警原因、报警时间、报警等级、报警内容信息进行处理。

用户操作/输入平台为用户提供系统管理页面,并提供报警事件的声光显示,主控系统与灾备系统的用户操作/输入平台(用户平台)同时对外服务,用户可以选择任意一点访问监控报警系统的用户操作界面。标准用户输入平台为用户提供对其业务端管理方式、报警方式、处理方式的修改、查询及定义,系统的功能都可以自由使用。而匿名用户输入平台,为非注册用户提供一个基本功能的运行平台,只有一些简单功能,如只能以显示屏的方便对其进行报警,不能自定义报警级别等;而管理员输入平台,为高级用户提供一个完全开放的自设定运行平台,如可以进行系统的配置、维护和升级操作。

灾备模块用于实现报警系统的主、备系统的统一控制,分为状态监控子模块、控制子模块,每个系统都分别有一套,其中状态监控子模块检查主、备系统的所有服务状态;控制子模块用于在两个系统出现异常状态时进行服务的切换。灾备模块分为主控端与备控端,当主控端良好时备控端仅进行心跳动作,不进行状态监控与服务控制,只有主控端出现故障(主控端、备控端通过心跳得知对方的好坏)时,备控端才接管状态监控与服务控制功能。

主控系统与灾备系统的数据库同时运行,但只有主控系统的数据库对外提供数据服务,而灾备系统的数据库进行同步实时备份,主控系统对其本身数据库的任何修改都能够通过实时触发器同步到灾备系统的数据库中,而且一旦主控系统的数据库出现故障,针对两个系统的所有其他服务都切换为访问灾备系统的数据库,同时对有问题的数据库进行修复。主控系统、灾备系统的数据库能够识别读取操作和写入操作,读取操作能够同时对主控系统、灾备系统的数据库进行操作,写入操作时只能对主控系统的数据库进行操作,写入数据由灾备模块自动备份到灾备系统的数据库。

报警接收服务将处理过的报警信息传到报警处理装置,报警处理装置根据报警信息内容按用户定义或系统定义发到短信发送装置、呈现装置、邮件发送装置,再由短信发送装置和邮件发送装置将信息发送到指定的接收人,而呈现装置可以控制业务端的一些声光报警装置(如报警铃、报警灯),来提醒值班人员注意。数据库提供了系统的数据存储功能,负责存储报警事件信息,各种配置信息;灾备模块提供系统的灾备框架,以提高系统的可靠性。

主控系统与灾备系统的短信发送装置同时对外服务,正常时每套系统都使用本系统的短信发送装置,一旦本系统的短信发送装置出现故障,则报警接收装置会将报警事件转发到对端的报警接收装置进行处理。

主控系统与灾备系统的邮件发送装置二者同时仅一个对外进行服务,这主要是为了保证邮件发送装置中邮件信息的一致性。一旦其中一个系统的邮件发送装置(如主控系统)出现故障无法对外服务,则监控系统会自动使用另外一个系统(如灾备系统)的邮件发送装置发送邮件。

如图2所示,本发明监控报警系统运行步骤如下:

A、由报警接收装置接收各个业务端的报警信息,首先对接收到的报警信息进行信息来源确认;报警事件信息包括但不限定于以下信息:报警对象、报警原因、报警事件、报警等级、报警内容信息;

1、按监控系统定义的统一报警事件接收的接口规范,认证报警信息的数据结构、使用协议、信息发送方式;报警对象标识发生报警的主体,报警原因是指对报警事件的分类,报警时间记录报警事件发生的时间,报警等级是对报警严重性的体现,报警内容是对报警的详细描述。

2、业务端合法性判断;判断发送报警信息的业务端是否为已注册的业务端;判断结果为否的时候,根据具体情况产生错误码,并将错误码返回给业务系统;

在判断结果为是的时候,将报警事件信息放入报警事件处理缓冲队列。

3、识别业务端在监控系统注册时的标识码;对认可的信息进行处理;包括报警对象、报警原因、报警事件、报警等级、报警内容信息分类。将报警信息分成报警事件和恢复事件;其中报警事件内容中包含了发生故障时的各种信息;恢复事件内容中包含了故障恢复时的各种信息。

4、按业务端设定的编码号来查询新接收报警事件是否接收过,按编码号查询是否有恢复事件对应的报警事件,按结果做相应处理;判断的依据是按照业务端设定的报警信息编码方式设计的报警事件的编号,此编号包含在报警事件信息结构中;对于已经接收过的报警事件将进行抛弃处理;对于未接收过的报警事件,将进行下一步处理。对于恢复事件,需要寻找是否存在匹配的报警事件,匹配的依据是报警事件中的编号项,如果存在编号项值一致的报警事件则进行进一步操作;如果不存在编号项值一致的报警事件则抛弃恢复事件。

B、将分类后的信息放入报警事件缓冲队列中;同时将新报警信息及报警恢复信息存入数据库,并且删除数据库中已恢复但还在发送队列的报警信息。系统更新存储模块中的报警事件信息状态,修改报警事件信息的记录,存储恢复事件、设置事件状态为已恢复。

C、按报警等级、时间优先从报警事件缓冲队列中提取报警事件信息进行处理;等级高、时间早的报警事件信息先处理,将处理结果传给报警处理装置;

D、报警处理装置按事先定义标准将接收到信息发送到短信发送装置、邮件发送装置,判断是否需要进行邮件和短信发送。发送策略限定了“满足一定条件的报警信息,通过指定的时间方式、物理方式,发送给指定的业务人员”的逻辑,包括系统定义的报警级别、发送方式,和用户定义的报警级别、发送方式。判断结果为需要邮件发送,则使用邮件发送模块发送邮件报警。系统使用内置的邮件服务器发送邮件信息,也可以使用第三方提供的邮件服务发送邮件信息。系统根据既有的邮件模板对报警事件信息进行组合,形成用于发送的报警邮件内容。如果判断结果为需要短信发送,则使用短信发送模块发送短信报警。系统采用专业的短信发送设备进行短信发送。系统根据既有的短信模板对报警事件信息进行组合,形成用于发送的报警短信内容。

本发明的监控报警系统至此完成整个报警事件的处理。本方法满足了报警事件的集中处理,并且能够实时将报警信息发送到用户的信箱与手机。

如图3所示,在监控报警系统运行时还包括主控系统和灾备系统灾备模块的自身检测步骤:

首先灾备控制程序判断本身是主还是备。在报警系统中,主、备系统分别具有灾备控制程序,在正常运行时只有主系统中的灾备控制程序实施主控操作,备系统中的灾备控制程序处于备用阶段。

按照判断结果进行处理如:灾备控制程序如果判断本身是备,则获取与主系统灾备控制程序的心跳信息,并判断心跳信息是否正常。心跳信息用于灾备控制程序得知对端系统灾备控制程序的运行状态。

备用灾备控制程序如果心跳判断结果为异常,则认为主灾备程序出现故障,备灾备程序接管灾备控制。

备用灾备控制程序如果心跳判断结果为正常,则不进行任何操作。

灾备控制程序判断如果需要进行主控操作,则查询已注册所有服务的运行状态。

对比本次获取的服务状态与上一次获取的服务状态,并判断是否需要进行服务控制。

如果判断结果是需要服务控制,则依据服务状态制定服务的控制逻辑。对服务的控制包括以下操作:停止服务的运行、修改服务的配置文件、重新启动服务。

如果判断结果是不需要服务控制,则终止本次检查。

在监控报警系统正常运行时,灾备模块每隔一段时间运行系统故障检测程序,如果正在运行时的系统出现问题,如:主控中心数据库发生故障,导致其不能够提供数据服务,灾备控制模块将修改报警引擎、用户平台数据库连接配置文件,由灾备系统接管所有报警服务,并暂停问题数据库的工作,控制灾备系统的数据库提供服务;经过一定的自动处理后,切换成使用灾备中心的数据库提供数据服务。其中自动处理的步骤如下:修改正常运行的报警引擎、用户平台的数据库连接配置文件,并重启报警引擎、用户平台到正常运行的灾备系统;设置主控中心的数据库运行标记位为“修复中”,避免在修复数据库的过程中使用主控中心的数据库。故障数据库的修复过程如下:修复主控系统数据库到能够使用的状态;手动同步灾备系统数据库的数据到主控中心数据库;修改报警引擎、用户平台的数据库连接配置文件,使用主控中心数据库,并重启;设置主控中心的数据库运行标记位为“已修复”。依照以上步骤,能够保证报警系统的灾备功能,从而提高系统的可靠性。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号