封面
声明
中文摘要
英文摘要
目录
第一章 绪论
1.1研究背景及意义
1.2本文主要研究内容
1.3本文章节安排
第二章 集群监控容错系统总体设计
2.1系统主要功能需求
2.2总体框架设计
2.3软件体系架构设计
2.4本章小结
第三章 集群监控
3.1集群监控系统的研究现状
3.2集群监控模块设计
3.3集群监控模块的实现
3.4效果展示
3.5本章小结
第四章 集群系统容错
4.1集群系统容错技术研究
4.2集群容错模块总体设计
4.3计算节点容错设计
4.4面向应用的作业检查点设计
4.5实验与分析
4.6本章小结
第五章 结束语
5.1工作总结
5.2工作展望
致谢
参考文献
攻硕期间取得的研究成果