【24h】

Compile-Time and Run-Time Issues in an Auto-Parallelisation System for the Cell BE Processor

机译:Cell BE处理器自动并行化系统中的编译时和运行时问题

获取原文

摘要

We describe compiler and run-time optimisations for effective auto-parallelisation of C++ programs on the Cell BE architecture. Auto-parallelisation is made easier by annotating sieve scopes, which abstract the 'read in, compute in parallel, write out' processing paradigm. We show that the semantics of sieve scopes enables data movement optimisations, such as re-organising global memory reads to minimise DMA transfers and streaming reads from uniformly accessed arrays. We also describe run-time optimisations for committing side-effects to main memory. We provide experimental results showing the benefits of our optimisations, and compare the Sieve-Cell system with IBM's OpenMP implementation for Cell.
机译:我们描述了针对Cell BE架构上C ++程序的有效自动并行化的编译器和运行时优化。通过注释筛子作用域可以使自动并行化变得更加容易,该作用域可以抽象化“读入,并行计算,写出”处理范例。我们展示了筛子作用域的语义能够优化数据移动,例如重新组织全局内存读取,以最大程度地减少DMA传输和从统一访问的数组进行的流读取。我们还描述了将副作用提交到主内存的运行时优化。我们提供的实验结果表明了我们进行优化的好处,并将Sieve-Cell系统与IBM针对Cell的OpenMP实现进行了比较。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号