声明
摘要
第1章绪论
1.1 研究背景
1.1.1 等离子体模拟应用提出的计算挑战
1.1.2神威·太湖之光与申威异构众核处理器SW26010
1.1.3神威·太湖之光上并行应用实现与性能优化所面临的挑战
1.2本文研究目标与工作内容
1.3论文结构
第2章相关工作
2.1 等离子体模拟问题
2.1.1等离子体基本模型
2.1.2等离子体模拟方法
2.2等离子体模拟应用SymPIC及其实现
2.2.1 等离子体模拟应用SymPIC
2.2.2 SymPIC在同构多核CPU平台的并行实现
2.2.3 SymPIC在商用CPU+GPU异构平台的并行实现
2.3神威平台上相关的科学计算工作
2.3.1 分子动力学模拟问题
2.3.2 stencil计算问题
2.3.3矩阵乘法与卷积计算问题
2.4本章小结
第3章SymPIC应用特征分析
3.1.1程序模块分析
3.1.2主要函数调用关系分析
3.2 SymPIC核心代码分析
3.2.1 核心计算代码结构分析
3.2.2核心计算代码数据结构
3.3软件运行时行为特征分析
3.3.1计算特征
3.3.2访存特征
3.3.3通信特征
3.3.4 I/O特征
3.4本章小结
第4章SymPIC在神威·太湖之光上的优化
4.1 SymPIC在神威·太湖之光上的并行化方案
4.2 SymPIC在神威平台上的瓶颈分析
4.3面向申威众核的向量化计算方案
4.3.1 隐式计算核心向量化
4.3.2显式计算核心向量化
4.4从核访存优化
4.4.1 通过DMA降低从核加载主存数据的时间开销
4.4.2通过数据重新排布提升向量数据加载效率
4.5数据缓冲方案
4.5.1基于软件模拟Cache的场数据缓冲
4.5.2基于多缓冲区的粒子数据预取
4.6分布式I/O方案
4.7本章小结
第5章SymPIC性能测试与分析
5.1 实验软硬件配置与测试算例
5.2不同优化策略的加速效果及分析
5.3可扩展性测试
5.4 SymPIC在神威·太湖之光上的软硬件受限情况分析
5.4.1 从核局部存储大小受限问题
5.4.2从核访主存带宽受限问题
5.4.3从核指令Cache受限
5.4.4系统软件受限
5.5本章小结
第6章全文总结
6.1研究工作总结
6.2本文创新点
6.3未来工作展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
在读期间参与的科研项目
中国科学技术大学;