基于GPU的稀疏矩阵向量乘优化

白洪涛; 欧阳丹彤; 李熙铭; 李亭; 何丽莉

首页> 中文期刊> 《计算机科学》 >基于GPU的稀疏矩阵向量乘优化

基于GPU的稀疏矩阵向量乘优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法.这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取.实验分析表明,提出的各种手段起到了优化的作用.与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上.

著录项

来源
《计算机科学》 |2010年第8期|168-171181|共5页
作者
白洪涛; 欧阳丹彤; 李熙铭; 李亭; 何丽莉;
展开▼
作者单位

吉林大学计算机科学与技术学院;

长春130012;

吉林大学计算机科学与技术学院;

长春130012;

吉林大学计算机科学与技术学院;

长春130012;

吉林大学计算机科学与技术学院;

长春130012;

吉林大学计算机科学与技术学院;

长春130012;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程 ;
关键词
稀疏矩阵 ; 行压缩存储; 图形处理器 ; 统一计算架构; 优化策略;

相似文献

中文文献
外文文献
专利

1. 基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化 [J] . 阳王东 ,李肯立 . 计算机工程与科学 . 2016 ,第002期
2. 基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 [J] . 王迎瑞 ,任江勇 ,田荣 . 计算机科学 . 2013 ,第003期
3. 基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化 [J] . 顾越 ,赵银亮 . 计算机工程与科学 . 2022 ,第1期
4. 基于GPU的稀疏矩阵存储格式优化研究 [J] . 杨世伟 ,蒋国平 ,宋玉蓉 . 计算机工程 . 2019 ,第009期
5. 基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究 [J] . 谢震 ,谭光明 ,孙凝晖 . 计算机研究与发展 . 2021 ,第003期
6. 基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 [C] . WANG Ying-Rui ,王迎瑞 ,REN Jiang-Yong . 2012全国高性能计算学术年会 . 2012
7. 基于GPU的稀疏矩阵向量乘和凸包算法研究 [A] . 杨世伟 . 2019

基于GPU的稀疏矩阵向量乘优化

摘要

著录项

相似文献

相关主题

期刊订阅