摘 要
Abstract
目 录
第1章 绪论
1.1 课题背景
1.1.1 课题来源
1.1.2 自主计算及重要性
1.1.3 带内故障检测在自主计算中的意义
1.2 国内外研究现状
1.2.1 带内故障检测概述
1.2.2 带内故障检测技术研究现状
1.3 本文主要研究内容
1.4 本文组织结构
第2章 故障检测模型
2.1 面向计算单元的故障划分标准
2.1.1 故障分类方法
2.1.2 面向计算单元的故障分类标准
2.1.3 面向计算单元的故障分类
2.2 故障检测模型
2.2.1 故障检测模型需要满足的条件
2.2.2 故障检测模型
2.3 通用故障检测系统设计方案
2.3.1 通用数据结构
2.3.2 通用故障检测过程
2.3.3 通用故障单元结构
2.3.4 通用故障消息结构
2.3.5 通用故障检测接口
2.4 本章小结
第3章 带内故障检测系统设计与实现
3.1 核心服务类故障检测工具
3.1.1 故障检测对象
3.1.2 故障检测原理
3.2 内核非数值型故障检测工具
3.2.1 故障检测对象
3.2.2 故障检测原理
3.3 内核数值型故障检测工具
3.3.1 整体介绍
3.3.2 cpu故障检测工具
3.3.3 内存故障检测工具
3.3.4 磁盘故障检测工具
3.3.5 网络故障检测工具
3.4 硬件层故障检测工具
3.4.1 故障检测对象
3.4.2 监控信息采集
3.5 本章小结
第4章 带内故障检测系统评测实验
4.1 实验环境
4.2 交互接口整体框架
4.2.1 交互接口整体框架
4.2.2 日志反馈记录
4.2.3 故障配置接口
4.2.4 故障单元库
4.3 基于动态配置的通用模型验证实验
4.3.1 动态配置对象对故障单元库接口的影响
4.3.2 动态配置对象对日志反馈记录接口的影响
4.3.3 动态配置故障单元对日志反馈记录接口的影响
4.4 基于故障注入的故障检测实验
4.4.1 应用层故障注入实验
4.4.2 内存泄露故障注入实验
4.4.3 可插拔设备空间不足故障注入实验
4.5 本章小结
结 论
参考文献
哈尔滨工业大学学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致谢