首页> 中文学位 >高可用服务器主动故障管理平台的研究与实现
【6h】

高可用服务器主动故障管理平台的研究与实现

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪论

1.1课题背景

1.2国内外研究现状

1.3本文主要研究内容

1.4本文组织结构

第2章 主动故障管理平台相关技术的研究

2.1主动故障管理系统概述

2.2主动故障管理平台关键技术的研究

2.3本章小结

第3章 故障管理平台的详细设计

3.1目标系统的整体架构

3.2主动故障管理平台的需求分析

3.3主动故障管理平台的详细设计

3.4本章小结

第4章 本地管理模块LFM的实现

4.1 LFM硬件的设计与实现

4.2 LFM软件的设计与实现

4.3本章小结

第5章 全局管理模块GFM的实现

5.1 GFM模块硬件的设计与实现

5.2 GFM模块软件的实现

5.3平台故障管理功能测试结果

5.4本章小结

结论

参考文献

攻读硕士期间发表的论文及其他成果

声明

致谢

展开▼

摘要

随着信息化的发展,国防、金融等重要领域对服务器的可用性提出了新的要求,传统的基于部件冗余来提高服务器可用性的方法已经无法适应当前的计算环境,发展以主动故障管理机制为核心的服务器管理技术已经成为当前国际上对高可用服务器研究的趋势。
  本文分析了主动故障管理的一般过程,就故障管理过程中的系统监控、故障诊断、故障预测以及故障恢复等问题进行了研究。在此基础上,针对一种基于CPCI的可扩展的刀片架构服务器,设计并实现了一个双层架构的主动故障管理平台,不但解决了服务器系统监控和故障管理的问题,还对目标服务器的可扩展性提供了支持。
  主动故障管理平台分为本地故障管理模块LFM和全局故障管理模块GFM两个部分。本地故障管理模块LFM主要解决故障管理中系统监控相关的问题,本文设计了一种带内外相结合的系统监控方案,并以此为基础实现了LFM的硬件和管理软件,使LFM能对目标系统的软硬件状态进行全面、实时的监控,并能根据设定的阈值产生相应软硬件的告警信息。全局故障管理模块GFM主要负责LFM模块的管理和系统的故障管理。GFM能够根据LFM收集到的系统状态信息进行故障的预测,并能根据LFM提供的故障告警信息进行故障的诊断和故障的恢复,GFM还支持系统管理员通过web页面进行远程控制,实现人工对故障管理过程的干预。此外,为保证故障管理平台的可用性,本文为GFM设计了一种基于双模冗余的容错方案。
  最后,本文针对目标系统进行结果验证,采用故障注入等方式对故障管理平台的故障诊断和故障预测功能进行了测试,实验结果证明了本文实现的故障管理平台的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号