文摘
英文文摘
图表目录
第一章 绪论
1.1 论文研究背景
1.2 论文研究内容
1.3 硬件平台和测试用例
1.4 论文结构
第二章 GPU体系结构与CUDA介绍
2.1 GPU体系结构
2.2 CUDA基础
2.2.1 CUDA编程模型
2.2.2 CUDA存储器模型
2.3 本章小结
第三章 KLU算法概述
3.1 KLU算法简介
3.2 预处理阶段介绍
3.2.1 btf(Block Triangular Form)算法
3.2.2 amd(Approximate Minimum Degree)算法
3.3 求解阶段
3.4 相关研究
3.4.1 btf_strongcomp算法的相关研究
3.4.2 amd算法的相关研究
3.5 本章小结
第四章 btf_strongcomp算法在GPU平台上的并行
4.1 深度优先搜索算法的并行
4.2 DCSC算法(divide and conquer strong components)
4.3 可达矩阵算法的并行
4.3.1 可达矩阵的定义及相关并行思想
4.3.2 并行算法存在的问题
4.4 zdec(Zero-descendant)算法
4.4.1 算法思想
4.4.2 算法性能分析
4.4.3 实验结果对整个KLU算法的影响
4.5 本章小结
第五章 klu solve算法在GPU平台上的并行
5.1 求解阶段(klu_solve算法)的并行性研究
5.1.1 并行算法分析
5.1.2 实验结果和性能分析
5.2 本章小结
第六章 总结与进一步工作
6.1 主要结论
6.1.1 btf_strongcomp算法
6.1.2 klu_solve算法
6.1.3 结论
6.2 进一步工作
参考文献
致谢