首页> 中国专利> 一种移动通信经营分析系统的监控方法

一种移动通信经营分析系统的监控方法

摘要

本发明涉及一种移动通信经营分析系统的监控方法。所述监控方法的具体步骤如下:一、对监控对象进行配置管理、系统管理;二、根据所述配置信息,由所述日常监控模块对所述各监控对象进行日常监控;三、由所述故障关联模块进行故障关联;四、由所述告警模块将上述监控结果、故障关联结果与所述配置信息进行比较,监控结果高于配置阈值或低于配置阈值,进行故障告警;五、由所述故障处理流程模块对故障发起故障处理流程;六、在处理故障过程中,采用知识库模块或专家支援模块进行支撑;七、监控历史存储、监控报表生成及风险评估。本发明的优点是具有高效、实时和安全性。

著录项

  • 公开/公告号CN101854277A

    专利类型发明专利

  • 公开/公告日2010-10-06

    原文格式PDF

  • 申请/专利权人 河北全通通信有限公司;

    申请/专利号CN201010198906.0

  • 发明设计人 李祎;吴明;宋炳乾;刘子砚;

    申请日2010-06-12

  • 分类号H04L12/26(20060101);H04L12/24(20060101);

  • 代理机构13100 石家庄新世纪专利商标事务所有限公司;

  • 代理人陈建民

  • 地址 050021 河北省石家庄市青园街220号

  • 入库时间 2023-12-18 01:00:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-12

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04L12/26 变更前: 变更后: 申请日:20100612

    专利权人的姓名或者名称、地址的变更

  • 2014-02-19

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04L12/26 变更前: 变更后: 申请日:20100612

    专利权人的姓名或者名称、地址的变更

  • 2012-04-25

    授权

    授权

  • 2010-11-24

    实质审查的生效 IPC(主分类):H04L12/26 申请日:20100612

    实质审查的生效

  • 2010-10-06

    公开

    公开

说明书

技术领域

本发明涉及一种移动通信经营分析系统的监控方法。

背景技术

移动通信的经营分析系统是一个具有相当规模的硬件、软件基础平台,它能够较好地支撑市场前端部门的应用。随着经营分析系统业务发展和工程建设的不断深入,主机系统、网络系统、操作系统、数据库和应用软件等IT系统的数量和类型不断增加,使经营分析系统的管理维护工作日趋复杂,对经营分析系统的稳定性、可靠性提出更高的要求,同时,对经营分析系统的风险评估工作也日趋复杂化。

中国专利《一种实现实时监控告警的通信系统及其方法》(专利号:200510132943.0),上述专利的技术方案为:

所述通信系统的服务器中包括了监控信息储存模块、话务统计定制模块和告警信息发送模块。所述方法为:在通信系统服务器中储存监控对象、监控时间、监控周期和监控阈值;根据上述储存的监控信息,制定话务统计任务,并执行话务统计,生成话务统计结果;将上述话务统计结果与监控阈值比较,当话务统计结果超过监控阈值,或话务统计结果低于监控阈值,或话务统计结果介于监控阈值范围内时,发送告警信息。

上述专利的缺点如下:

1、对业务监控、系统监控、网络监控及硬件监控等进行的监控为单一监控,不能进行统一的监控,统一展现,统一告警。

2、对监控指标的阈值定义过于单一,不能根据监控业务的不同采用不同的故障评判方法,如绝对值比较法,相邻比较法、中位数比较法,均值比较法,标准差比较法等等。

3、对故障告警以后,对故障的处理情况不能进行有效的跟踪。

4、只能对单一的故障进行告警,不能对由于该故障引起的后续影响进行评估及预警。

5、对监控历史的查询、分析功能较弱,不能定期自动形成监控结果报表。

6、针对系统故障发生的特点及频率,不能定期自动对系统稳定性进行风险评估。

7、监控平台没有建立详尽的知识库,处理故障时监控平台不能根据故障给出相关的知识库支持。

发明内容

本发明所要解决的技术问题是针对现有技术存在的缺点,而提供具有高效、实时和安全性的一种移动通信经营分析系统的监控方法。

本发明解决其技术问题所采用的技术方案:

首先组建统一监控维护平台,所述统一监控维护平台包括配置管理模块、系统管理模块、日常监控模块、故障关联模块、故障告警模块、故障流程处理模块、知识库模块、专家支援模块、监控历史存储模块、监控报表生成模块和风险评估模块;

所述监控方法的具体步骤如下:

一、对监控对象进行配置管理、系统管理:

(1)监控对象配置管理:利用所述配置管理模块对各监控对象的监控阈值、监控周期、告警方式进行配置,即给出配置信息并存入配置表中;

(2)由所述系统管理模块进行系统管理:人员组织管理,增加和删除机构,增加和删除人员;角色权限管理,增加角色和为人员赋予角色权限;

二、根据所述配置信息,由所述日常监控模块对所述各监控对象进行日常监控:

所述日常监控模块包括作业运行情况监控、接口情况监控、系统性能监控、数据实体监控及业务指标监控;

三、由所述故障关联模块进行故障关联:

获取关联数据的方式包括自动获取方式及手工录入方式;自动获取方式是对各故障功能点,由程序分别解析各故障功能点对应的运行日志、ETL日志、SQL日志,解析完成后转化为固定格式的EXCEL文件,所述EXCEL文件中包括源对象、关系名称、目标对象;对于没有运行日志的故障功能点,则采用手工方式直接录入EXCEL文件;

解析完成后,进行各故障功能点关联、整合,即对各EXCEL文件进行解析、关联;最终形成各故障功能点之间的关联关系,并在数据库中存储;

四、由所述告警模块将上述监控结果、故障关联结果与所述配置信息进行比较,监控结果高于配置阈值或低于配置阈值,进行故障告警:

对监控发现的异常故障对象,发起短信告警流程,包括自动化短信告警和人工短信告警;

五、由所述故障处理流程模块对故障发起故障处理流程:

对各监控点的故障进行监控,发起故障处理流程,通知维护人员及时解决故障问题。

六、在处理故障过程中,采用知识库模块或专家支援模块进行支撑;

七、监控历史存储、监控报表生成及风险评估:

由所述监控历史存储模块将监控结果进行存储,由所述监控报表生成模块根据监控历史数据生成监控报表,然后,由所述风险评估模块根据监控报表数据进行系统风险评估,对各监控点的故障率、故障频率、故障特点进行评估,并对各监控点进行风险评估,分为:稳定、低风险、高风险等级。

本发明的有益效果如下:

(1)能够对业务监控、系统监控、网络监控及硬件监控等进行统一监控,统一展示,统一告警。

(2)在故障告警以后,对故障的处理情况能够进行有效的追踪。

(3)不仅能对单一的故障进行告警,并且能够对由于该故障引起的后续影响进行评估及预警。

(4)能够对监控历史进行查询、分析,定期自动形成监控结果报表。

(5)对经营分析系统故障发生的情况,能定期自动对经营分析系统的稳定性进行风险评估。

(6)能够利用知识库处理故障。

(7)对经营分析系统的监控具有高效、实时和安全性。

附图说明

图1为本发明的功能架构图;

图2为本发明的体系架构图;

图3为故障功能点关联过程图;

图4为故障处理流程图。

具体实施方式

如附图1-3所示,本实施例首先组建统一监控维护平台,所述统一监控维护平台包括配置管理模块、系统管理模块、日常监控模块、故障关联模块、故障告警模块、故障流程处理模块、知识库模块、专家支援模块、监控历史存储模块、监控报表生成模块和风险评估模块(见图1);

图2为本发明的体系架构图,本发明的体系架构分为五层,分别为监控数据获取层,监控功能层,数据存储层,应用层和访问层。

(1)监控数据获取层:包括数据源、接口文件、ETL作业、数据实体、应用指标、系统性能等经营分析系统全方位保障数据。

(2)监控功能层:包括配置管理、系统管理、故障关联获取、知识库、专家支援等相关后台支撑功能模块。

(3)数据存储层:包括监控数据、知识库、专家方案等数据存储。

(4)应用层:包括业务监控、系统监控、故障告警、故障处理流程、监控报表生成、风险评估等相关前端应用功能点。

(5)访问层:监控数据呈现主要包括WEB展现、短信、OA等。

所述监控方法的具体步骤如下:

一、对监控对象进行配置管理、系统管理:

(1)监控对象配置管理:利用所述配置管理模块对各监控对象的监控阈值、监控周期、告警方式进行配置,即给出配置信息并存入配置表中;

(2)由所述系统管理模块进行系统管理:人员组织管理,增加和删除机构,增加和删除人员;角色权限管理,增加角色和为人员赋予角色权限;

二、根据所述配置信息,由所述日常监控模块对所述各监控对象进行日常监控:

所述日常监控模块包括作业运行情况监控、接口情况监控、系统性能监控、数据实体监控及业务指标监控,(见表1);

三、由所述故障关联模块进行故障关联(见图3):

获取关联数据的方式包括自动获取方式及手工录入方式;自动获取方式是对各故障功能点,由程序分别解析各故障功能点对应的运行日志、ETL日志、SQL日志,解析完成后转化为固定格式的EXCEL文件,所述EXCEL文件中包括源对象、关系名称、目标对象;对于没有运行日志的故障功能点,则采用手工方式直接录入EXCEL文件;

解析完成后,进行各故障功能点关联、整合,即对各EXCEL文件进行解析、关联;最终形成各故障功能点之间的关联关系,并在数据库中存储;

四、由所述告警模块将上述监控结果、故障关联结果与所述配置信息进行比较,监控结果高于配置阈值或低于配置阈值,进行故障告警:

对监控发现的异常故障对象,发起短信告警流程,包括自动化短信告警和人工短信告警;

五、由所述故障处理流程模块对故障发起故障处理流程(见图4):

对各监控点的故障进行监控,发起故障处理流程,通知维护人员及时解决故障问题。

六、在处理故障过程中,采用知识库模块或专家支援模块进行支撑;

七、监控历史存储、监控报表生成及风险评估:

由所述监控历史存储模块将监控结果进行存储,由所述监控报表生成模块根据监控历史数据生成监控报表(算法见表2)。然后,由所述风险评估模块根据监控报表数据进行系统风险评估,对各监控点的故障率、故障频率、故障特点进行评估,并对各监控点进行风险评估,分为:稳定、低风险、高风险等级。

所述配置管理是通过下述功能页实现的:

(1)查询页面:缺省取出所述配置表所有数据,可通过监控对象进行定位查询,增加、修改、删除统一从查询页面分流;

(2)增加页面:填写输入项,执行所述配置表插入操作;

(3)修改页面:对应查询页面,取出相应数据进行修改,执行修改操作。

所述日常监控的实现是对日常监控点各故障功能点均采用配置方式进行监控;同时,根据监控业务的不同,分别采用如下的监控方法:

(4)接口及时性监控和作业运行情况监控采用固定值比较法:

对需要监控的接口进行配置,定义每个接口文件到达的时间,对晚于到达时间的接口则告警;

作业运行情况状态取值于数据仓库中,定义作业运行情况的告警状态,对于异常的作业状态则进行告警;

(5)接口准确性监控、数据实体及业务指标监控:

根据具体业务及数据特性的不同,采用下述的判断算法中的一种或两种以上的组合,监控需要满足所有的判断条件,否则告警;

算法一、相邻数据周期比较法;

算法二、历史数据周期中位数比较法;

算法三、历史数据周期均值比较法;

算法四、历史数据周期标准差比较法;

算法五、绝对值阈值边界比较法。

(6)系统性能监控:

采用程序获取系统的各类性能指标,获取到异常则告警。

所述故障告警的实现过程如下:

(1)监控发现异常故障对象;

(2)将故障对象保存到监控异常结果当前表;

(3)将故障对象组装成短信告警内容,存放到短信告警信息表;

(4)生成短信告警文本文件;

(5)将短信告警文件推送到短信平台;

(6)由短信平台发布短信到相关人员。

所述故障处理流程如下:

(1)监控发现异常故障对象;

(2)将故障对象保存到监控异常结果当前表,形成故障对象处理;

(3)向故障负责人发起短信告警流程;

(4)故障负责人对故障对象处理进行解决跟进;

(5)若故障对象处理已解决,发起封闭流程,填写相关信息;

(6)对故障对象处理确认封闭。

所述知识库的更新及搜索流程如下:

(1)发布新知识点:登记/编辑知识点内容存放到知识库表,附件存放到文件系统;

(2)在知识库搜索知识:定位知识点,并可下载对应附件。

所述专家支援的更新及搜索流程如下:

(1)发布新专家方案:登记专家方案条目,新增专家方案步骤内容存放到专家方案库表,附件存放到文件系统。

(2)搜索浏览专家方案:定位专家方案,浏览操作步骤,并下载对应附件。

表1:监控故障功能点表:

表2:监控报表算法口径定义表:

  指标ID指标名称  地市公司要求达标值[%]算法描述1数据源及时率全省90  (数据源及时性监控接口总数-已封闭故障数-未封闭故障数)/数据源接口总数*100%2数据源准确率全省90  (数据源准确性监控接口总数-已封闭故障数-未封闭故障数)/数据源接口总数*100%3一经及时率全省99  (一经及时性监控总数-已封闭故障数-未封闭故障数)/一经接口总数*100%4一经准确率全省99  (一经准确性监控总数-已封闭故障数-未封闭故障数)/一经接口总数*100%5作业无故障率全省90  (作业监控总数-已封闭故障数-未封闭故障数)/作业总数*100%6装载无故障率全省90  (装载作业监控总数-已封闭故障数-未封闭故障数)/装载作业总数*100%7实体无故障率全省90  (实体监控总数-已封闭故障数-未封闭故障数)/实体总数*100%8指标无故障率全省90  (指标监控总数-已封闭故障数-未封闭故障数)/指标总数*100%9主机无故障率全省99  (主机总数-已封闭故障数-未封闭故障数)/主机总数*100%10网络无故障率全省99  (网络监控总数-已封闭故障数-未封闭故障数)/网络总数*100%11  文件系统无故障率全省99  (文件系统监控总数-已封闭故障数-未封闭故障数)/文件系统总数*100%

  指标ID指标名称  地市公司要求达标值[%]算法描述12数据库无故障率全省99  (数据库总数-已封闭故障数-未封闭故障数)/数据库进程总数*100%13  服务进程无故障率全省99  (服务进程监控总数-已封闭故障数-未封闭故障数)/服务进程总数*100%14故障解决率全省99  已封闭故障数/(已封闭故障数+未封闭故障数)*100%15故障解决及时率全省90  及时解决故障数/(已封闭故障数+未封闭故障数)*100%

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号