首页> 中文学位 >川庆公司云模式网络预警系统的设计与实现
【6h】

川庆公司云模式网络预警系统的设计与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究工作的背景与意义

1.2 国内外研究历史与现状

1.3 本文的主要贡献与创新

1.4 本论文的结构安排

第二章 云模式网络预警系统的基础研究

2.1 分布式网络监控

2.2 异步消息队列

2.3 专家系统

2.4 本章小结

第三章 需求分析

3.1 背景

3.2 任务概述3.2.1 目标

3.3 需求分析

3.4 测试环境约定3.4.1 物理环境约定

3.5 本章小结

第四章 系统功能的分析与设计

4.1 功能用例分析与设计

4.2 用例设计

4.3 数据流分析与设计

4.4 数据设计

4.5 测试设计

4.6 本章小结

第五章 系统实现

5.1 数据表结构实现

5.2 Nagios插件实现

5.3 消息聚合与故障判定的实现

5.4 数据输出功能实现

5.5 本章小结

第六章 系统测试

6.1 功能测试的设计与实现

6.2 性能测试

6.3 本章小结

第七章 全文总结与展望

7.1 全文总结

7.2 后续工作展望

致谢

参考文献

展开▼

摘要

在类似于石油工程类型企业的信息化运维建设过程中,大型异地分支机构的存在使得单一节点的信息化运维工作变得非常困难,在各地派驻运维人员的代价太高,人员等难以得到保障。我们通过对具有异地分布式机房环境的分析和研究,将网络监控系统的预警信息与消息队列、专家系统相结合,为运维服务台提供第一手资料,为服务台生成工单提供了报警来源。本文主要分析了川庆钻探物探公司的分布式网络情况,重点对分布式运维监控部署、预警消息传输、专家系统报警消息识别等方面进行了研究,提出了一套在分布式环境下的监控预警机制。
  研究是以领域驱动设计的思想和方法,以Nagios监控软件、异步消息队列、专家系统作为研发的主要技术,采用UML2作为设计方法,在实现过程中坚持敏捷开发过程,以构架适用于分布式机房环境的运维预警体系为基本目标,并实现了一个符合ITIL要求的分布式运维预警系统的实现。
  本项目是按照川庆公司的运维要求进行的,针对诸如物探公司、国际工程等各地均有机房,运维水平不一致的情况进行研究与设计,按照运维监控实时性高、具备一定预先提示的要求,考虑到监控预警系统通常有大量的低等级报警、重复同一报警、对正常停机检修的误报警等,大量的信息必须通过专家系统进行预分,只将重要的消息传输到运维平台中;在传输过程中可能出现网络异常,要保证消息完事准确的传递到运维平台,可以选用异步消息队列技术;由于分布式环境下,预警消息通常来自于不同的监控体系,将其中的信息进行合理的配对,得到相对精准的故障定位。预警系统主要是为服务台提供故障申报,是在故障处理流程之前,减少报警噪音是系统必须重点考虑的因素。
  系统的实现是通过部署开源Nagios系统,结合RabbitMQ异步消息队列,采用Ruby on Rails+专家系统插件进行研发,主要目的是验证其可行性。预警消息的输出符合Restful Service的标准格式,为未来集成入整个运维框架提供了支持。目前系统最大支持为2个节点,未来可扩展到更多节点。
  本文通过研究与实现论证了分布式机房的网络监控预警,这种去中心化的监控技术,可以让少量的技术专家集中在一地快速解决问题,从而提升运维效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号