稀疏对称矩阵的LDL^(T)分解在GPU上的高效实现

陈鑫峰; 王武

首页> 中文期刊> 《数据与计算发展前沿》 >稀疏对称矩阵的LDL^(T)分解在GPU上的高效实现

稀疏对称矩阵的LDL^(T)分解在GPU上的高效实现

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

【目的】LDLT分解是求解很多稀疏对称线性系统的有效工具之一,尤其是对于迭代法难以收敛的问题。然而在GPU上实现LDLT分解存在困难,因为分解过程中存在数据依赖和不规则的数据访问。【方法】本文设计并实现了一个基于GPU的稀疏对称矩阵的LDLT分解,它采用Cholesky的符号分解和右视分解算法、稀疏矩阵依赖图的层次划分,以及CUDA的动态并行核调度技术,算法的所有三层循环都并行化,从而获得更高的并行度。【结果】实验结果表明,针对稀疏对称矩阵的一个典型的测试集,在GPU上实现的LDLT分解相对于UMFPACK最高加速46.2倍。【结论】LDLT分解CUDA实现策略可为高性能GPU异构平台上开展稀疏矩阵的高性能数值算法研究与实现提供借鉴。

著录项

来源
《数据与计算发展前沿》 |2021年第3期|P.136-147|共12页
作者
陈鑫峰; 王武;
展开▼
作者单位

中国科学院计算机网络信息中心北京100190中国科学院大学北京100049;

中国科学院计算机网络信息中心北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
LDLT分解; 右视算法; GPU; 动态并行;

相似文献

中文文献
外文文献
专利

1. 稀疏对称矩阵的LDLT分解在GPU上的高效实现 [J] . 陈鑫峰 ,王武 . 数据与计算发展前沿 . 2021,第003期
2. 并行对称矩阵三对角化算法在GPU集群上的有效实现 [J] . 刘世芳 ,赵永华 ,于天禹 . 计算机研究与发展 . 2020,第012期
3. 基于GPU的SAR方位向信号分解的高效实现方法 [J] . 张相广 ,吴长朋 ,高叶盛 . 太赫兹科学与电子信息学报 . 2012,第001期
4. LU分解和Laplace算法在GPU上的实现 [J] . 陈颖 ,林锦贤 ,吕暾 . 计算机应用 . 2011,第003期
5. 一种高效直方图生成算法在GPU上的实现 [J] . 狄鹏 ,胡长军 ,李建江 . 计算机科学 . 2012,第003期
6. 利用GPU加速实现共轭梯度法求解稀疏线性方程组 [C] . 杨帆 ,王昆 ,施彤年 . 2012年第14届中国系统仿真技术及其应用学术年会 . 2012
7. 基于GPU的多波前稀疏Cholesky分解优化方法的研究 [A] . 王伟 . 2015

稀疏对称矩阵的LDL^(T)分解在GPU上的高效实现

摘要

著录项

相似文献

相关主题

期刊订阅