基于LLVM的科学计算程序自动性能预测研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

得益于计算机硬件的发展，现在大规模计算和并行计算得到了空前的关注。其相关配套的性能分析和评测技术也提上议程。科学计算并行程序(下简称科学程序)的分析显然和以前的单进程程序有所区别。科学程序通常有计算密集、高度并行、很少依赖第三方库等特点。科学程序的并行通常是SPMD(Single Program Multiple Data)类型，常用MPI协议实现。
　　性能模型用于描述程序的特征。最直接的即是预测程序的执行时间，常为一组公式。而这里用一个起名为DwarfCode(下简称 DC)的程序作为性能模型来预测程序执行时间。DC是在原程序的基础上结合LLVM和编译技术来生成的。在IR阶段通过分析程序里的循环次数结合 LLVM的静态分支概率，生成计算每个基本块次数的指令并进行插桩；然后使用视点提升算法来调整插桩位置，同时寻找通信语句并生成计算通信量的指令来插桩。之后分析数据依赖进行删减，从而使得执行 DC花费的时间比原程序少，体现预测性。由于从原程序中删减得来，DC的输入和原来一致。运行DC生成包含预测的基本块次数的profiling文件，再结合机器特征能计算出预测的原程序执行时间。以及更为细致的预测的每个基本块执行次数和每个函数的时间，总共通信所花费的时间等等。
　　本文最大的贡献是提出了视点的概念，将静态分析方法和动态EdgeProfiling方法两个极端有机地统一起来。提出静态性等于预测性，动态性等于准确性的观点。本文最大的创新之处在于抛弃编译优化等价变换的固有观念，采用破坏性的删减的方法，在尽量不改变程序特征的前提下抛弃程序的输出结果，删减计算部分代码，运行DC的时间更少。提出预测代价和预测性价比的概念，指出在性价比大于1的时候，才有实施预测的意义。
　　本文指出性能模型由程序特征和机器特征所决定，将两者分离从而使得DC的输出满足迁移性，和目标平台无关。DC执行简单，使用方便。无需任何相关领域知识，无需任何参数设定，无需任何配置文件，无需了解代码结构。无需预先做任何训练。不仅磁盘空间开销小，而且时间开销和内存开销相对于原程序也小。
　　在CGPOP和EP的实验中，分析了DC的结果，通过对误差的分析，指出了分支概率误差的存在。最后将所有代码和测试数据开源，方便所有人重做实验，验证结果或是继续开发。

著录项

作者
谢虎成;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机技术
授予学位硕士
导师姓名张伟哲;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.52;
关键词
科学计算程序; 性能预测; 并行计算; 编译优化; 分支概率误差;
入库时间 2022-08-17 10:36:58

相似文献

中文文献
外文文献
专利

1. 基于西门子840D数控系统的直线度自动计算程序研究 [J] . 王全宝 ,林树海 ,施兆伟 . 制造技术与机床 . 2017,第006期
2. 基于LLVM的编译锁机制技术研究与实现 [J] . 巩令钦 ,沈莉 ,周清雷 . 计算机应用与软件 . 2021,第011期
3. Win32平台下基于LLVM的代码混淆技术研究 [J] . 张泉 ,舒辉 ,李婧睿 . 信息工程大学学报 . 2018,第004期
4. 基于LLVM的函数内联优化技术研究 [J] . 郭振华 ,吴艳霞 ,安龙飞 . 计算机工程与应用 . 2017,第003期
5. 基于VB.NET的子午线收敛角自动计算程序设计 [J] . 纪浩 ,潘旭 ,薛明 . 铁法科技 . 2020,第002期
6. 一种基于LLVM的并行程序性能预测框架 [C] . Hao Meng ,郝萌 ,Zhang Weizhe . 2016年全国高性能计算学术年会 . 2016
7. 面向申威平台的LLVM自动向量化移植与优化 [A] . 李嘉楠 . 2021

基于LLVM的科学计算程序自动性能预测研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅