首页> 中文学位 >面向自主计算的带内故障检测系统的研究与设计
【6h】

面向自主计算的带内故障检测系统的研究与设计

代理获取

目录

摘 要

Abstract

目 录

第1章 绪论

1.1 课题背景

1.1.1 课题来源

1.1.2 自主计算及重要性

1.1.3 带内故障检测在自主计算中的意义

1.2 国内外研究现状

1.2.1 带内故障检测概述

1.2.2 带内故障检测技术研究现状

1.3 本文主要研究内容

1.4 本文组织结构

第2章 故障检测模型

2.1 面向计算单元的故障划分标准

2.1.1 故障分类方法

2.1.2 面向计算单元的故障分类标准

2.1.3 面向计算单元的故障分类

2.2 故障检测模型

2.2.1 故障检测模型需要满足的条件

2.2.2 故障检测模型

2.3 通用故障检测系统设计方案

2.3.1 通用数据结构

2.3.2 通用故障检测过程

2.3.3 通用故障单元结构

2.3.4 通用故障消息结构

2.3.5 通用故障检测接口

2.4 本章小结

第3章 带内故障检测系统设计与实现

3.1 核心服务类故障检测工具

3.1.1 故障检测对象

3.1.2 故障检测原理

3.2 内核非数值型故障检测工具

3.2.1 故障检测对象

3.2.2 故障检测原理

3.3 内核数值型故障检测工具

3.3.1 整体介绍

3.3.2 cpu故障检测工具

3.3.3 内存故障检测工具

3.3.4 磁盘故障检测工具

3.3.5 网络故障检测工具

3.4 硬件层故障检测工具

3.4.1 故障检测对象

3.4.2 监控信息采集

3.5 本章小结

第4章 带内故障检测系统评测实验

4.1 实验环境

4.2 交互接口整体框架

4.2.1 交互接口整体框架

4.2.2 日志反馈记录

4.2.3 故障配置接口

4.2.4 故障单元库

4.3 基于动态配置的通用模型验证实验

4.3.1 动态配置对象对故障单元库接口的影响

4.3.2 动态配置对象对日志反馈记录接口的影响

4.3.3 动态配置故障单元对日志反馈记录接口的影响

4.4 基于故障注入的故障检测实验

4.4.1 应用层故障注入实验

4.4.2 内存泄露故障注入实验

4.4.3 可插拔设备空间不足故障注入实验

4.5 本章小结

结 论

参考文献

哈尔滨工业大学学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

展开▼

摘要

自主计算由IBM公司于2001年10月提出,旨在通过技术管理技术的手段来降低复杂性,提高系统可用性。故障检测是自主计算最基本、最核心的功能之一,带内故障检测面向一个独立的计算节点,检测系统运行于OS之上,检测过程包含了自主计算的监控和部分诊断功能。
  本文就带内故障检测的覆盖率问题、有效性问题进行了研究,定义了针对计算单元的故障划分标准,主要解决了故障检测模型的建立和故障检测工具的实现两个问题。
  故障检测模型主要解决故障对象的检测、动态配置、系统查询3方面问题,该模型将各种故障检测对象、检测过程、检测结果标准化,增加系统可配置型和灵活性。
  在故障模型的指导下,实现了硬件层、内核数值型、内核非数值型、应用层四个层次的故障检测工具集。这四个工具对系统从上到下、从服务到操作系统OS再到硬件状态、从计算密集型到访存密集型再到IO密集型应用都有覆盖。
  本文针对Linux操作系统进行结果验证,将故障检测结果与其它监控工具进行结果比对,同时模拟构造了各种故障情况并对回收结果进行分析。实验表明,本文所实现的故障检测工具集,基本上能够检测到测试对象发生时的各种异常情况,能够实时将检测结果发送给后续处理模块。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号