首页> 中文学位 >并行程序性能建模关键技术研究
【6h】

并行程序性能建模关键技术研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第 1章绪论

1.1 课题来源及研究的目的和意义

1.2 相关领域的进展与成果

1.3 本文的主要研究工作

1.4 本文的组织结构

第 2章并行程序的计算模型

2.1 问题描述

2.2 获取机器指令时间

2.3 循环次数获取

2.4 基本块次数插桩实现

2.5 算法对比实验

2.6 本章小结

第 3章并行程序的通讯分析

3.1 问题描述

3.2 点对点通信函数建模

3.3 集合通信函数建模

3.4 通信数据插桩实现

3.5 本章小结

第 4章实验结果与分析

4.1实验对象及平台介绍

4.2 开发工具介绍

4.3 相关技术

4.4 实验过程

4.5 本章小结

结论

参考文献

攻读硕士学位期间发表的论文及其它成果

声明

致谢

展开▼

摘要

随着程序处理的数据规模逐渐增大,单处理器已经不能满足研究者对计算资源的需求。研究者开始将高性能计算应用到实际生活中,包括科学计算程序。本文研究的重点是对并行程序建立性能模型的关键技术进行研究,最后在实验对象NPB和CGPOP程序上验证这些关键技术。
  并行程序的执行时间划分为计算和通信两部分,其中,全部计算指令的执行时间作为计算时间,全部通信函数的调用时间构成通信时间。
  对于计算部分时间的获取,影响因素有指令条数以及指令执行时间。机器指令的执行时间与运行平台有关,其平台参数通过基准测试程序获取。本文的研究重点是影响指令条数的循环次数的获取,设计并实现了LoopAnalysis算法。该算法是分析IR代码的循环结构,获取循环次数依赖的变量,从而确定循环次数。使用LoopAnalysis算法与GCC提供的ScalarEvolution算法分别获取实验对象循环的执行频率,实验证明LoopAnalysis算法取得更好地效果。
  科学计算程序的通信一般是基于MPI协议的,这部分时间的获取是通过对通信函数建立模型实现的。通信函数分为点对点通信和集合通信,其调用时间与程序并行度和通信量有关。基于LogGP模型的分析,分段线性函数对点对点通信的测试数据拟合达到较好效果。集合通信的时间关于并行度和数据量是非线性,通过神经网络模型对测试数据进行拟合,最终确定神经网络模型的结构和参数作为通信函数的模型。实验表明基于神经网络的通信函数模型较好地拟合了集合通信的测试数据。
  应用上述技术来预测实验对象的基本块的执行频率、计算时间、通信时间,与实验对象的真实运行情况作对比,计算相对误差。指出造成误差可能的原因以及改进的方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号