文摘
英文文摘
第一章绪言
1.1概述
1.2本文研究背景
1.2.1SMP机群编程模型研究背景
1.2.2机群系统并行调试研究背景
1.3本文研究内容
1.3.1SMP机群编程模型研究和实例分析
1.3.2机群系统并行调试研究和曙光3000远程并行调试器的设计与实现
1.4本文组织结构
1.5小结
第二章SMP机群体系结构
2.1概述
2.2传统并行计算机体系结构
2.2.1共享存储体系结构
2.2.2分布式存储体系结构
2.2.3分布式共享存储体系结构
2.3 SMP机群体系结构
2.3.1并行计算机体系结构的发展趋势
2.3.2 SMP机群的体系结构
2.3.3 SMP机群的特点
2.3.4 SMP机群的优点
2.3.5 SMP机群互连网络
2.3.6 SMP机群分类
2.3.7 SMP机群实例分析
2.4 小结
第三章SMP机群编程模型
3.1概述
3.2传统并行编程模型
3.2.1共享变量编程模型
3.2.2消息传递编程模型
3.2.3数据并行模型
3.3 SMP机群编程模型综述
3.3.1单一存储编程模型
3.3.2混合存储模型
3.3.3 SMM与HMM比较
3.3.4几个重要问题的分析
3.4细粒度并行化OPENMP+MPI混合编程模型
3.4.1混合编程模型分析
3.4.2实现机制
3.4.3优化措施
3.4.4需要注意的问题
3.5相关工作介绍
3.5.1SIMPLE
3.5.2 KeLP2
3.5.3 NICAM
3.6小结
第四章SMP机群混合编程模型实例分析
4.1概述
4.2曙光3000系统
4.2.1体系结构
4.2.2硬件系统
4.2.3软件系统
4.3测试平台
4.4测试实例和测试结果
4.4.1代码编写
4.4.2关于时间函数的选择
4.4.3编译和运行
4.4.4测试结果
4.5测试结果分析
4.5.1SMP机群性能的衡量标准
4.5.2 SMP机群提高了普通机群的性能
4.5.3 SMP机群提高了SMP的可扩放性
4.5.4 SMP节点内的有效线程数
4.5.5内存总线竞争
4.5.6 MPI 进程的通信与性能的关系
4.6相关工作介绍
4.7小结
第五章机群系统并行程序调试
5.1概述
5.2并行调试简介
5.2.1不确定性
5.2.2探针效应
5.2.3大时间开销
5.2.4通讯问题
5.2.5性能调试问题
5.3并行调试技术
5.3.1断点调试
5.3.2全局断点
5.3.3记录/重放调试
5.3.4渐增检查点
5.3.5事件分析
5.3.6静态分析
5.4并行调试的一般步骤
5.5并行调试器的设计与实现
5.5.1应用对并行调试器的需求
5.5.2前期设计
5.5.3初步实现
5.5.4功能开发
5.5.5维护
5.6小结
第六章曙光3000远程并行调试器的设计与实现
6.1概述
6.2曙光3000远程并行调试器系统介绍
6.2.1 RPB特性
6.2.2 RPB使用的准备工作
6.2.3 RPB系统使用界面
6.3曙光3000远程并行调试器设计思想
6.3.1应用对远程并行调试的需求
6.3.2传统的远程并行调试方法
6.3.3远程并行调试器RPB设计思想
6.3.4并行调试器的界面设准则
6.4曙光3000远程并行调试器技术路线
6.4.1并行调试技术
6.4.2开发语言
6.4.3远程通信技术
6.4.4开发环境
6.4.5我们选择的技术路线的好处
6.5曙光3000远程并行调试器实现方法
6.5.1体系结构
6.5.2接口定义
6.5.3服务器端实现方法
6.5.4客户端实现方法
6.6曙光3000远程并行调试器性能测试
6.6.1正确性测试
6.6.2容错性测试
6.6.3网络传输性能测试
6.6.4并行调试性能测试
6.7相关工作比较
6.8小结
第七章结束语
7.1本文主要研究内容
7.1.1 SMP机群编程模型研究
7.1.2机群系统并行调试
7.2本文主要创新点
7. 3进一步的研究工作
7. 3.1SMP机群编程模型的进一步研究工作
7.3.2机群系统并行调试的进一步工作
致谢
参考文献
重要术语中英文索引