首页> 中文学位 >神威·太湖之光上数据流编程模型的设计与实现
【6h】

神威·太湖之光上数据流编程模型的设计与实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景

1.1.1.神威·太湖之光

1.1.2.传统编程模型在神威·太湖之光上面临的挑战

1.1.3.数据流模型

1.2 论文研究目标和主要工作

1.3 论文结构

第2章 相关研究工作

2.1 现有的若干基于数据流的编程模型

2.1.1.SWARM

2.1.2.Charm++

2.1.3.TensorFlow

2.2 Codelet程序执行模型

2.2.1.基本单元

2.2.2.激发规则

2.2.5.抽象机器模型

2.3 DARTS运行时系统

2.3.1.运行时系统的实现

2.3.2.实例研究

2.4 本章小结

第3章 SunwayFlow:神威·太湖之光上的一种数据流编程模型

3.1 机器模型的抽象

3.1.1.单核组单SU方案

3.1.2.单核组多SU方案

3.1.3.本文采取的映射方案

3.2 程序执行模型的设计

3.2.1.去除TP结构

3.2.2.预激发状态

3.3 编程接口

3.3.1.Runhme类

3.3.2.SchedulingUint类

3.3.3.ComputeUnit类

3.3.4.Codelet类

3.3.5.本节小结

3.4 本章小结

第4章 SunwayFlow运行时系统的设计与实现

4.1 运行机制

4.1.1.Codelet状态转换

4.1.2.SU和CU的协作模式

4.1.3.CU运行机制

4.1.4.数据移动

4.2 关键技术

4.2.1.状态变量倍增

4.2.2.ID池

4.2.3.就绪codelet队列

4.2.4.任务分配与执行

4.2.5.资源释放与调度管理

4.2.6.SU优先模式

4.2.7.虚拟CU模式

4.3 本章小结

第5章 实例研究

5.1 HPCG概述

5.2 强数据依赖的核心计算函数优化

5.2.1.SymGS算法简述

5.2.3.数据流优化方法

5.2.4.实验结果分析

5.3 无数据依赖的核心计算函数优化

5.3.1.SPMV优化

5.3.2.DDOT和WAXPBY优化

5.4 HPCG整体性能测试分析

5.4.1.串行版本性能测试分析

5.4.2.MPI版本性能二测试分析

5.4.3.本节小结

5.5 本章小结

第6章 全文总结

6.1 研究工作总结

6.2 主要创新点

6.3 未来工作展望

参考文献

致谢

在读期间发表的学术论文与取得的研究成果

在读期间参与的科研项目

展开▼

摘要

在片上集成大量异构的计算资源成为近几十年来众核处理器设计的主流。目前世界上浮点计算性能最高的超级计算机,神威·太湖之光,由40960个异构众核处理器SW26010构成;每个SW26010有260个计算核。受限于神威·太湖之光上现有的并行编程模型(MPI和Athread库等)的编程语义的描述能力,如何在神威·太湖之光上使用这些编程模型,来产生足够的计算任务提供给众多的计算核心、平衡异构计算资源间的任务负载、处理各计算任务之间的数据依赖关系,给用户带来了极大的挑战。
  Codelet模型是一种结合了数据流和控制流方法的细粒度程序执行模型,由特拉华大学的高光荣教授提出。本文的研究工作基于Codelet模型,在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow,并实现了其运行时系统,旨在为编程者提供一种有效地解决其计算问题、高效地利用片上计算资源的方法。本文通过基准测试程序HPCG作为研究实例,以验证SunwayFlow数据流编程模型及其运行时系统的有效性。
  本文主要研究内容和工作成果如下:
  (1)在神威·太湖之光上设计了一种基于数据流的编程模型,SunwayFlow。基于Codelet模型,提出了抽象机器模型到神威·太湖之光的映射方案,移除了Threaded Procedure结构、引入了预激发状态,并定义了编程模型的编程接口。
  (2)在神威·太湖之光上实现了SunwayFlow编程模型的运行时系统。针对神威·太湖之光系统软硬件的特点来设计运行时系统的运行机制,采取了若干关键技术提高运行时系统的性能和适用性。用户通过使用运行时系统提供的接口函数,构建自己的数据流程序,然后运行时系统能够高效地、自动地完成该程序的调度和计算。
  (3)将HPCG所有的核心计算函数通过SunwayFlow编程模型进行重构。尤其是针对对称Gauss Seidel松弛(SymGS)算法,使用了一种全新的并行方法,即数据流方法。在单核组情况下,对比于HPCG参考版本的实现,我们的优化版本在SymGS执行时间和HPCG性能上分别取得了11.79倍和10.31倍的加速。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号