首页> 外文OA文献 >Implementation of Parallel Code Generator under Static Execution Control and Proposal of Performance Tuning Tool for Automatic Parallelizing Translator for C Programs
【2h】

Implementation of Parallel Code Generator under Static Execution Control and Proposal of Performance Tuning Tool for Automatic Parallelizing Translator for C Programs

机译:静态执行控制下并行代码生成器的实现以及C程序自动并行翻译器性能调整工具的建议

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In our automatic parallelizing translator for sequential C programs with MPI, a set of all statements in a block scope is defined as a compound task. In this paper, at first, we implemented a parallelism analyzer for the inner levels of hierarchy of scopes in any compound task. By using this analyzer, we analyzed single loops and nested loops whose processing time may take the most of total processing time of a program in general. Although it seems that a loop has no parallelism at a glance, the loop may be restructured to have parallelism by eliminating data dependencies, called loop distribution. In addition, in order to reduce more processing time of for-loops, a code restructuring method, that has extract the efficiency of cache memory, has been implemented. These implementation result in reducing parallel processing time remarkably.
机译:在针对带有MPI的顺序C程序的自动并行化转换器中,块作用域中的所有语句的集合被定义为复合任务。在本文中,首先,我们为任何复合任务中范围的内部层次实现了并行分析器。通过使用此分析器,我们分析了单循环和嵌套循环,它们的处理时间通常可能占用程序总处理时间的大部分。尽管循环看起来似乎没有并行性,但可以通过消除称为循环分布的数据依赖关系来将循环重构为具有并行性。另外,为了减少更多的for循环处理时间,已经实现了提取高速缓冲存储器的效率的代码重构方法。这些实现导致显着减少并行处理时间。

著录项

  • 作者

    近藤 竜也; 甲斐 宗徳;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种 JPN
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号