首页> 中文学位 >基于OpenMP的热点级猜测并行化编译研究
【6h】

基于OpenMP的热点级猜测并行化编译研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 研究背景和意义

1.2 研究现状

1.3 设计流程

1.4 论文结构

2 OpenMP架构

2.1 OpenMP简介

2.2 OpenMP编程模型

2.3 OpenMP指导语法

2.2.1 线程创建

2.2.2 任务共享

2.2.3 OpenMP子句

2.2.4 用户级运行时库

2.2.5 环境变量

2.4 OpenMP编译器中的实现和优缺点比较

2.5 OpenMP性能和测试用例

2.6 本章小结

3 TLS编译技术

3.1 TLS技术介绍

3.2 TLS设计选择

3.2.1 并行控制方式

3.2.2 数据版本管理方式

3.2.3 冲突检测方式

3.3 典型TLS系统介绍

3.3.1 Hydra CMP

3.3.2 STAMPede

3.4 现有TLS实现比较

3.5 本章小结

4 基于OpenMP的热点级TLS实现

4.1 OpenMP speculative子句实现

4.1.2 Speculative子句功能

4.1.2 Speculative子句实现

4.2 热点级TLS实现

4.2.1 热点判断机制实现

4.2.2 动态执行机制实现

4.2.3 执行时流

4.3 本章小结

5 性能测试与分析

6.总结与展望

6.1 论文总结

6.2 展望

参考文献

作者简历

展开▼

摘要

随着多核处理器的发展,并行化编译技术,特别是循环体的并行化编译技术,越来越受到重视。TLS(Thread level speculation)编译,即猜测并行化编译,可将原来顺序运行的程序并行化。但由于猜测数据的不确定性引起的数据管理开销过大,以及猜测线程失败引起的线程回滚开销,使得并行后的性能提升有限。另外一方面,并行编程对于普通程序开发者难度过大,需要了解底层硬件相关知识并考虑并行分配以及软硬件开销问题,使得并行编程并不能广泛使用。本文针对TLS编译中数据管理和线程回滚开销过大以及并行编程的问题,提出了基于OpenMP的热点级猜测并行化编译框架。基于OpenMP的热点级并行化编译框架标记能有效并行化的循环体为热点循环体,采用对最高层次热点循环体进行更激进的并行化的方式提高性能,而对非热点循环体采用保守的顺序执行以减少开销。基于OpenMP的热点级并行化编译框架基于OpenMP并行编程接口,有利于程序开发者提高并行编程效率。实验表明,使用基于OpenMP的热点级并行化编译框架,可以提高实验程序20%的执行效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号