首页> 中文期刊>计算机系统应用 >基于申威1621处理器的BLAS一级函数优化

基于申威1621处理器的BLAS一级函数优化

     

摘要

BLAS (Basic Linear Algebra Subprograms)是一个基本线性代数操作的数学函数标准, 该库函数分为三个级别, 每个级别提供了向量与向量(1级)、向量与矩阵(2级)、向量与向量(三级)之间的基本运算. 本文研究了在申威1621处理器上BLAS一级函数的优化方案, 以函数AXPY为例, 充分利用平台的架构特点对其进行性能调优,设计了自动的线程分配方案. 实验结果显示优化过后的BLAS一级函数AXPY相对于GotoBLAS参考实现版本的单核和多核加速比分别高达4.36和9.50, 对于每种优化方式均得到了一定的性能提升.

著录项

  • 来源
    《计算机系统应用》|2021年第7期|246-252|共7页
  • 作者

    李浩然; 王磊;

  • 作者单位

    中原工学院 计算机学院 郑州 450007;

    中原工学院 前沿信息技术研究院 郑州 450007;

    中原工学院 计算机学院 郑州 450007;

    中原工学院 前沿信息技术研究院 郑州 450007;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    申威1621; BLAS; 并行; 线程分配; SIMD向量化;

  • 入库时间 2022-08-20 07:39:03

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号