...
首页> 外文期刊>Concurrency and Computation >Emmerald: a fast matrix-matrix multiply using Intel's SSE instructions
【24h】

Emmerald: a fast matrix-matrix multiply using Intel's SSE instructions

机译:Emmerald:使用英特尔SSE指令的快速矩阵矩阵乘法

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Gereralized matrix-matrix multiplication forms the kernel of many mathematical algorithms, hence a faster matrix-matrix multiply immediately benefits these algorithms. In this paper we implement efficient matrix multiplication for large matrices using the Intel Pentium single instruction multiple data (SIMD) floating point architecture. The main difficulty with the Pentium and other commodity processors is the need to efficiently utilize the cache hierarchy, particularly given the growing gap between main-memory and CPU clock speeds.
机译:广义矩阵矩阵乘法构成许多数学算法的核心,因此更快的矩阵矩阵乘法立即使这些算法受益。在本文中,我们使用Intel Pentium单指令多数据(SIMD)浮点架构为大型矩阵实现了有效的矩阵乘法。奔腾和其他商用处理器的主要困难是需要有效利用高速缓存层次结构,尤其是考虑到主内存和CPU时钟速度之间的差距越来越大时。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号