首页> 中文学位 >神威平台上等离子体保结构大规模模拟的并行算法分析与优化
【6h】

神威平台上等离子体保结构大规模模拟的并行算法分析与优化

代理获取

目录

声明

摘要

第1章绪论

1.1 研究背景

1.1.1 等离子体模拟应用提出的计算挑战

1.1.2神威·太湖之光与申威异构众核处理器SW26010

1.1.3神威·太湖之光上并行应用实现与性能优化所面临的挑战

1.2本文研究目标与工作内容

1.3论文结构

第2章相关工作

2.1 等离子体模拟问题

2.1.1等离子体基本模型

2.1.2等离子体模拟方法

2.2等离子体模拟应用SymPIC及其实现

2.2.1 等离子体模拟应用SymPIC

2.2.2 SymPIC在同构多核CPU平台的并行实现

2.2.3 SymPIC在商用CPU+GPU异构平台的并行实现

2.3神威平台上相关的科学计算工作

2.3.1 分子动力学模拟问题

2.3.2 stencil计算问题

2.3.3矩阵乘法与卷积计算问题

2.4本章小结

第3章SymPIC应用特征分析

3.1.1程序模块分析

3.1.2主要函数调用关系分析

3.2 SymPIC核心代码分析

3.2.1 核心计算代码结构分析

3.2.2核心计算代码数据结构

3.3软件运行时行为特征分析

3.3.1计算特征

3.3.2访存特征

3.3.3通信特征

3.3.4 I/O特征

3.4本章小结

第4章SymPIC在神威·太湖之光上的优化

4.1 SymPIC在神威·太湖之光上的并行化方案

4.2 SymPIC在神威平台上的瓶颈分析

4.3面向申威众核的向量化计算方案

4.3.1 隐式计算核心向量化

4.3.2显式计算核心向量化

4.4从核访存优化

4.4.1 通过DMA降低从核加载主存数据的时间开销

4.4.2通过数据重新排布提升向量数据加载效率

4.5数据缓冲方案

4.5.1基于软件模拟Cache的场数据缓冲

4.5.2基于多缓冲区的粒子数据预取

4.6分布式I/O方案

4.7本章小结

第5章SymPIC性能测试与分析

5.1 实验软硬件配置与测试算例

5.2不同优化策略的加速效果及分析

5.3可扩展性测试

5.4 SymPIC在神威·太湖之光上的软硬件受限情况分析

5.4.1 从核局部存储大小受限问题

5.4.2从核访主存带宽受限问题

5.4.3从核指令Cache受限

5.4.4系统软件受限

5.5本章小结

第6章全文总结

6.1研究工作总结

6.2本文创新点

6.3未来工作展望

参考文献

致谢

在读期间发表的学术论文与取得的研究成果

在读期间参与的科研项目

展开▼

著录项

  • 作者

    卢帆;

  • 作者单位

    中国科学技术大学;

  • 授予单位 中国科学技术大学;
  • 学科 计算机系统结构
  • 授予学位 硕士
  • 导师姓名 韩文廷,安虹;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算数学;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号