首页> 外文期刊>Przeglad Elektrotechniczny >Programming NVIDIA cards by means of transitive closure based parallelization algorithms
【24h】

Programming NVIDIA cards by means of transitive closure based parallelization algorithms

机译:通过基于传递闭包的并行化算法对NVIDIA卡进行编程

获取原文
获取原文并翻译 | 示例
       

摘要

Przetwarzanie równoległe na wielką skalę wykonywane jest za pomocą wielu procesorów (również graficznych) wykonujących jednocześnie instrukcje pojedynczego programu. Ponieważ większość obliczeń zlokalizowana jest w pętlach programowych, automatyczne zrównoleglanie kodu jest ważne dla maszyn wielordzeniowych. W artykule zbadano przyspieszenie i skalowalność równoległego kodu złożonego z niezależnych fragmentów lub harmonogramowania swobodnego za pomocą maszyny Tesla S1070 zbudowanej z 960 rdzeni CUDA.%Massively parallel processing is a type of computing that uses many separate CPUs or GPUs running in parallel to execute a single program. Because most computations are contained in program loops, automatic extraction of parallelism available in loops is extremely important for many-core systems. In this paper, we study speed-up and scalability of parallel code scanning synchronization-free slices and time partitions by means of a 960 CUDA Cores machine, Tesla S1070.
机译:大规模并行处理是在许多处理器(也是图形处理器)的帮助下执行的,这些处理器同时执行单个程序的指令。由于大多数计算都位于程序循环中,因此自动代码并行化对于多核计算机非常重要。本文使用由960个CUDA内核构建的Tesla S1070计算机检查了由独立片段或自由调度组成的并行代码的加速性和可伸缩性。%大规模并行处理是一种计算类型,其使用许多并行运行的独立CPU或GPU来执行单个程序。因为大多数计算都包含在程序循环中,所以对于多核系统而言,自动提取循环中可用的并行性极为重要。在本文中,我们通过960 CUDA Cores机器Tesla S1070研究了并行代码扫描的无同步切片和时间分区的加速和可扩展性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号