首页> 外国专利> Compiling a parallel loop with a complex access pattern for writing an array for GPU and CPU

Compiling a parallel loop with a complex access pattern for writing an array for GPU and CPU

机译:编译具有复杂访问模式的并行循环以编写用于GPU和CPU的阵列

摘要

Computer-implemented methods are provided for compiling a parallel loop and generating Graphics Processing Unit (GPU) code, and Central Processing Unit (CPU) code for writing an array for the CPU and the CPU. A method includes compiling the parallel loop by (i) checking, based on a range of array elements to be written, whether the parallel loop can update all of the array elements and (ii) checking whether an access order of the array elements that the parallel loop reads or writes is known at compilation time. The method further includes determining an approach, from among a plurality of available approaches, to generate the CPU code and the GPU code based on (i) the range of the array elements to be written and (ii) the access order to the array elements in the parallel loop.
机译:提供了计算机实现的方法,用于编译并行循环并生成图形处理单元(GPU)代码,以及用于为CPU和CPU编写数组的中央处理单元(CPU)代码。一种方法包括通过以下方式编译并行循环:(i)基于要写入的数组元素的范围检查并行循环是否可以更新所有数组元素,以及(ii)检查数组元素的访问顺序是否满足以下条件:在编译时已知并行循环读取或写入。该方法还包括:基于(i)要写入的阵列元素的范围和(ii)对阵列元素的访问顺序,从多种可用方法中确定一种方法来生成CPU代码和GPU代码。在并行循环中。

著录项

  • 公开/公告号US10394536B2

    专利类型

  • 公开/公告日2019-08-27

    原文格式PDF

  • 申请/专利权人 INTERNATIONAL BUSINESS MACHINES CORPORATION;

    申请/专利号US201715448032

  • 发明设计人 KAZUAKI ISHIZAKI;

    申请日2017-03-02

  • 分类号G06F9/44;G06F13/36;G06F17/30;G06F9/46;G06F9/30;G06F8/41;G06F9/455;G06F8/20;

  • 国家 US

  • 入库时间 2022-08-21 12:14:49

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号