您现在的位置: 首页> 研究主题> 并行编译

并行编译

并行编译的相关文献在1990年到2022年内共计88篇,主要集中在自动化技术、计算机技术、一般工业技术、无线电电子学、电信技术 等领域,其中期刊论文77篇、会议论文7篇、专利文献19383篇;相关期刊28种,包括管理观察、电子学报、计算机工程等; 相关会议7种,包括2007年全国高性能计算学术年会、2006年全国高性能计算学术会议(HPC 2006)、2006中国计算机学会体系结构专委会学术年会等;并行编译的相关文献由159位作者贡献,包括赵荣彩、张平、董春丽等。

并行编译—发文量

期刊论文>

论文:77 占比:0.40%

会议论文>

论文:7 占比:0.04%

专利文献>

论文:19383 占比:99.57%

总计:19467篇

并行编译—发文趋势图

并行编译

-研究学者

  • 赵荣彩
  • 张平
  • 董春丽
  • 韩林
  • 胡长军
  • 许卓群
  • 杨学军
  • 谢立
  • 余华山
  • 朱传琪
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 李雁冰; 赵荣彩; 韩林; 赵捷; 徐金龙; 李颖颖
    • 摘要: 异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.
    • 牛当当; 刘磊; 吕帅
    • 摘要: 基于超扩展规则,证明了EPCCL(Each Pair Contains Complementary Literal)理论的合并过程是可并行执行的,并设计了针对多个EPCCL理论的并行合并算法PUAE(Parallel computing Union of Any number of EPCCL).通过对EPCCL理论原始子句集的利用,提出了另一种高效的EPCCL理论并行合并算法imp-PUAE(improvement of PUAE).UKCHER(computing Union sets of maximum terms for Knowledge Compilation based on Hyper Extension Rule)是一种可并行的EPCCL理论编译算法,分别利用PUAE和imp-PUAE设计了两个并行知识编译算法P-UKCHER(UKCHER with PUAE)和impP-UKCHER(UKCHER with imp-PUAE).实验结果表明:P-UKCHER算法虽然没有提升UKCHER算法的效率,但能够提升UKCHER算法编译结果的质量,最好情况下可提升4倍;而impP-UKCHER算法能够提高UKCHER算法的效率,同时也能够提升编译结果的质量"同样最好情况下可提升4倍.%Based on HER (hyper extension rule), we prove that the parallelization of merging multiple EPCCL (each pair contains complementary literal) is feasible, and the corresponding algorithm PUAE (parallel computing union of any number of EPCCL) is proposed. Through using the origin CNF formulae of EPCCL theories, another efficient merging algorithm imp-PUAE (improvement of PUAE) is proposed. UKCHER (computing union sets of maximum terms for knowledge compilation based on hyper extension rule) is a knowledge compilation algorithm for EPCCL, which can be parallelized. Based on the above methods, we proposed two parallel knowledge compilation algorithms i. e., P-UKCHER (UKCHER with PUAE) and impP-UKCHER (UKCHER with imp-PUAE), which use the PUAE algorithm and imp-PUAE algorithm, respectively. Experimentally, although P-UKCHER does not improve the efficiency of UKCHER, the compilation quality is improved. In the best case, the compilation quality can be improved by 4 times with P-UKCHER. The impP-UKCHER can improve the efficiency and compilation quality of UKCHER at the same time, and the compilation quality can also be improved by 4 times in the best case.
    • 王建花; 陈朝晖
    • 摘要: 多面体模型只能表示循环中访存数组下标可以用仿射表达式表示的循环,针对这个限制设计一种基于动态分析的方法对多面体模型的表示范围进行扩展.该方法利用程序运行时的动态信息,将循环非仿射表达式中的循环全局参数用定值替换,推测生成非仿射循环的参数定值化版本,使之可以被多面体模型表示.该方法扩展了多面体模型的表示范围,使更多的代码区域可以被并行优化,提高了程序中SCoP的覆盖率,提高了程序运行的加速比.实验证明了该方法的有效性.
    • 赵捷; 赵荣彩; 了锐; 陈达智
    • 摘要: 针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法.该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信.实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序.%Some redundant communications are introduced in parallel compilation of distributed-memory multi-computers to guarantee the consistency of program data. To solve this problem, this paper proposes an optimizing communications calculating algorithm. Based on dependence analysis and inter-procedural data-flow analysis, the algorithm can figure out more accurate communications data by traversing the Define-Use graph and eliminate the redundant communications generated by procedure calls. Experimental results show that using the results of the algorithm to generate MPI communications code can reduce the communications data and the speed-up ratio is close to manual MPI parallel program.
    • 赵捷; 赵荣彩; 丁锐; 黄品丰
    • 摘要: Existing distributed memory parallelizing compiler systems are mostly developed based on shared systems. The parallelism recognition technologies of shared memory parallelizing compiler systems are suitable for OpenMP code generation. Their implementation is used to recognize all nested loops by the same technology, so that the parallelism cannot be efficiently explored when applying them to distributed memory parallelizing compiler systems. Thus, this paper proposes some parallelism recognition technologies suitable for the MPI code generation for distributed memory parallelizing compiler systems by classifying the nested loops according to their structures. To solve these problems, a new classification method of nested loops is proposed, according to the structure of nested loops and characteristics of MPI parallel program. Corresponding parallelism recognition technologies for different nested loops are also presented, respectively. The experimental results show that compared with the distributed memory parallelizing compiler systems that used existing parallelism recognition technologies, the compiler systems, which use the proposed classification method and the corresponding recognition technologies, can more efficiently recognize parallel nested loops in the benchmark programs, and the performance speedup of the MPI codes automatically increased to more than 20%.%传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高效发掘程序的并行性.分布存储并行编译系统应根据嵌套循环结构的特点进行分类处理,提出适合MPI代码生成的并行识别技术.为解决上述问题,根据嵌套循环的结构和MPI并行程序的特点,提出了一种新的嵌套循环分类方法,并针对不同的嵌套循环分别提出了相应的并行识别技术.实验结果表明,与采用传统并行识别技术的分布存储并行编译系统相比,按照所提方法对嵌套循环进行分类,采用相应并行识别技术的编译系统能够更高效地识别基准程序中的并行循环,自动生成的MPI并行代码其性能加速比提高了20%以上.
    • 郭慎; 李培峰; 朱巧明
    • 摘要: Exploring parallelisable points of codes in program is the first step of parallel compiling technology. In this paper,we propose a novel method based on SVM to mine the parallelisable points in running program according to the features it uses to represent the parallelity of program, including program executing time, circulation partof program, data dependency analysis, and ratio of execution time and the times of circulation, etc. Experimental results show that the parallelisable points mined by our method meet the needs of practical application much better,and the mined points can get considerable performance speedup ratio after to be parallelised.%并行编译技术的首要问题就是程序中可并行点的发现.以程序执行时间、程序中的循环部分、数据依赖性分析以及程序执行时间与循环次数比等特征来表征程序的可并行性,并采用SVM根据以上特征进行程序中的可并行点的挖掘.实验证明,该方法更能符合实际应用的需要,发现的可并行点做并行化后有可观的性能加速比.
    • 黄春; 赵克佳
    • 摘要: With the rapid development of computer science,especially computer architecture,compiler technology is facing a huge challenge.Therefore,this needs us to strength the teaching of compiler technology and open advanced compiler courses for graduate students%随着计算机技术的不断发展,尤其是计算机体系结构的发展,编译器面临极大的挑战。这要求我们进一步加强和发展编译教学,在研究生阶段开设编译高阶课程。本文介绍国防科学技术大学研究生高级编译技术课程,包括课程内容、安排和实践,给出了国际其他大学开设研究生阶段编译课程的情况介绍。
    • 闫昭; 刘磊
    • 摘要: 为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略.在采用LL(1)方法实现自顶向下语法分析的并行编译中,LL(1)分析表的生成一直处于关键地位,由于文法中的终结符和非终结符个数很多,分析表的构造成为提高语法分析速度的瓶颈问题,因此考虑采用LL(1)分析表的并行生成.算法采用多线程的工作模式,并借助于线程间的通讯机制实现,此并行处理方法对编译的并行处理和提高效率有理论和现实意义.
    • 刘晓娴; 赵荣彩; 梁玲
    • 摘要: 针对分布存储结构计算机系统在并行编译过程中存在的问题,提出一种消除冗余通信的暴露集求解算法,分别采用数组数据流分析和自干扰分析技术对嵌套循环中的流依赖和输入依赖进行分析,从而得到暴露集空间.仿真实验结果表明,将该算法所得结果作为后端生成数据分布通信代码的依据,可有效消除冗余通信,提高系统整体性能.
    • 丁锐; 赵荣彩; 韩林
    • 摘要: 在并行化编译中,代码生成属于编译器的后端,决定着并行程序的执行效率.数据划分将计算循环中被重定义或没被读引用的数据映射到处理器,按照数据划分生成通信代码会产生冗余通信.提出了利用数组数据流分析求解暴露集,并建立计算划分、循环迭代以及暴露集的不等式限制系统,最后通过FME(fourier Motzkin elimination)消元生成数据分布代码的优化算法.测试结果表明该算法对数据分布的优化效果明显.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号