首页> 外文会议>5th International Symposium on High Performance Computing ISHPC 2003; Oct 20-22, 2003; Tokyo-Odaiba, Japan >Performance Evaluation of Low Level Multithreaded BLAS Kernels on Intel Processor Based cc-NUMA Systems
【24h】

Performance Evaluation of Low Level Multithreaded BLAS Kernels on Intel Processor Based cc-NUMA Systems

机译:基于Intel处理器的cc-NUMA系统上的低级多线程BLAS内核的性能评估

获取原文
获取原文并翻译 | 示例

摘要

Parallel implementation of the BLAS library for sparse matrix algorithms in computational linear algebra is a critical problem, especially on the shared memory architectures with finite memory bandwidth. In this study, we evaluate the performance of the cc-NUMA systems using low level multithreaded BLAS kernels. The performance of both the compiler and the systems are evaluated on two Intel processor based architectures, NEC TX7/AzusA and IBM xSeries 440.
机译:对于计算线性代数中的稀疏矩阵算法,BLAS库的并行实现是一个关键问题,尤其是在具有有限存储带宽的共享存储体系结构上。在这项研究中,我们评估使用低级多线程BLAS内核的cc-NUMA系统的性能。在两种基于Intel处理器的体系结构NEC TX7 / AzusA和IBM xSeries 440上评估了编译器和系统的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号