您现在的位置：首页> 研究主题> 并行编译

并行编译

并行编译的相关文献在1990年到2022年内共计88篇，主要集中在自动化技术、计算机技术、一般工业技术、无线电电子学、电信技术等领域，其中期刊论文77篇、会议论文7篇、专利文献19383篇；相关期刊28种，包括电子学报、计算机工程、计算机工程与设计等；相关会议7种，包括2007年全国高性能计算学术年会、2006年全国高性能计算学术会议（HPC 2006）、2006中国计算机学会体系结构专委会学术年会等；并行编译的相关文献由159位作者贡献，包括赵荣彩、张平、董春丽等。

并行编译—发文量

期刊论文>

论文：77篇占比：0.40%

会议论文>

论文：7篇占比：0.04%

专利文献>

论文：19383篇占比：99.57%

总计：19467篇

并行编译—发文趋势图

并行编译
-研究学者

赵荣彩
张平
董春丽
韩林
胡长军
许卓群
杨学军
谢立
余华山
朱传琪
胡铭曾
臧斌宇
陈渝
陈福接
于勐
张兆庆
张宏莉
林红军
王珏
赵捷
龚雪容
丁强
丁文魁
丁锐
刘勇
刘敏
刘磊
吴木子
姚新宇
孙钟秀
张亚
彭岳星
戴华东
戴金海
方滨兴
李东
李建江
杜澎
杨博
杨晓
汪剑平
漆锋滨
王丽宏
王文博
王珊珊
罗勇
耿双
臧婉瑜
赵慧
过敏意

并行编译
-相关主题

并行编译
-相关期刊

并行编译
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(1)
2019
(1)
2018
(1)
2016
(1)
2012
(2)
2011
(2)
2009
(4)
2008
(6)
2007
(5)
2006
(4)
2005
(8)
2004
(1)
2003
(4)
2002
(6)
2001
(7)
2000
(6)
1999
(8)
1998
(1)
1997
(3)
1996
(2)
1995
(1)
1994
(2)
1990
(2)

期刊

收录数据库

作者

赵荣彩
(14)
张平
(8)
董春丽
(8)
韩林
(8)
胡长军
(7)
许卓群
(6)
杨学军
(5)
谢立
(5)
余华山
(4)
朱传琪
(4)
胡铭曾
(4)
臧斌宇
(4)
陈渝
(4)
陈福接
(4)
于勐
(3)
张兆庆
(3)
张宏莉
(3)
林红军
(3)
王珏
(3)
赵捷
(3)
龚雪容
(3)
丁强
(2)
丁文魁
(2)
丁锐
(2)
刘勇
(2)
刘敏
(2)
刘磊
(2)
吴木子
(2)
姚新宇
(2)
孙钟秀
(2)
张亚
(2)
彭岳星
(2)
戴华东
(2)
戴金海
(2)
方滨兴
(2)
李东
(2)
李建江
(2)
杜澎
(2)
杨博
(2)
杨晓
(2)
汪剑平
(2)
漆锋滨
(2)
王丽宏
(2)
王文博
(2)
王珊珊
(2)
罗勇
(2)
耿双
(2)
臧婉瑜
(2)
赵慧
(2)
过敏意
(2)

关键词

申请/权力人

;

1. Parallelizing Compilation Framework for Heterogeneous Many-core Processors一种面向异构众核处理器的并行编译框架北大核心 CSCD CSTPCD
- 李雁冰；赵荣彩；韩林；赵捷；徐金龙；李颖颖
- 摘要：异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.
2. Parallel Knowledge Compilation Algorithms for EPCCL TheoryEPCCL理论的并行知识编译算法北大核心 CSCD CSTPCD
- 牛当当；刘磊；吕帅
- 摘要：基于超扩展规则,证明了EPCCL(Each Pair Contains Complementary Literal)理论的合并过程是可并行执行的,并设计了针对多个EPCCL理论的并行合并算法PUAE(Parallel computing Union of Any number of EPCCL).通过对EPCCL理论原始子句集的利用,提出了另一种高效的EPCCL理论并行合并算法imp-PUAE(improvement of PUAE).UKCHER(computing Union sets of maximum terms for Knowledge Compilation based on Hyper Extension Rule)是一种可并行的EPCCL理论编译算法,分别利用PUAE和imp-PUAE设计了两个并行知识编译算法P-UKCHER(UKCHER with PUAE)和impP-UKCHER(UKCHER with imp-PUAE).实验结果表明:P-UKCHER算法虽然没有提升UKCHER算法的效率,但能够提升UKCHER算法编译结果的质量,最好情况下可提升4倍;而impP-UKCHER算法能够提高UKCHER算法的效率,同时也能够提升编译结果的质量"同样最好情况下可提升4倍.%Based on HER (hyper extension rule), we prove that the parallelization of merging multiple EPCCL (each pair contains complementary literal) is feasible, and the corresponding algorithm PUAE (parallel computing union of any number of EPCCL) is proposed. Through using the origin CNF formulae of EPCCL theories, another efficient merging algorithm imp-PUAE (improvement of PUAE) is proposed. UKCHER (computing union sets of maximum terms for knowledge compilation based on hyper extension rule) is a knowledge compilation algorithm for EPCCL, which can be parallelized. Based on the above methods, we proposed two parallel knowledge compilation algorithms i. e., P-UKCHER (UKCHER with PUAE) and impP-UKCHER (UKCHER with imp-PUAE), which use the PUAE algorithm and imp-PUAE algorithm, respectively. Experimentally, although P-UKCHER does not improve the efficiency of UKCHER, the compilation quality is improved. In the best case, the compilation quality can be improved by 4 times with P-UKCHER. The impP-UKCHER can improve the efficiency and compilation quality of UKCHER at the same time, and the compilation quality can also be improved by 4 times in the best case.
3. A Non-Affine Extension Method of Polyhedral Model Based on Dynamic Analysis基于动态分析的多面体模型非仿射扩展方法 CSCD CSTPCD
- 王建花；陈朝晖
- 摘要：多面体模型只能表示循环中访存数组下标可以用仿射表达式表示的循环,针对这个限制设计一种基于动态分析的方法对多面体模型的表示范围进行扩展.该方法利用程序运行时的动态信息,将循环非仿射表达式中的循环全局参数用定值替换,推测生成非仿射循环的参数定值化版本,使之可以被多面体模型表示.该方法扩展了多面体模型的表示范围,使更多的代码区域可以被并行优化,提高了程序中SCoP的覆盖率,提高了程序运行的加速比.实验证明了该方法的有效性.
4. 基于Define-Use图的MPI通信求解算法MPI Communication Solving Algorithm Based on Define-Use Graph 北大核心 CSCD CSTPCD
- 赵捷；赵荣彩；了锐；陈达智
- 摘要：针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法.该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信.实验结果表明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序.%Some redundant communications are introduced in parallel compilation of distributed-memory multi-computers to guarantee the consistency of program data. To solve this problem, this paper proposes an optimizing communications calculating algorithm. Based on dependence analysis and inter-procedural data-flow analysis, the algorithm can figure out more accurate communications data by traversing the Define-Use graph and eliminate the redundant communications generated by procedure calls. Experimental results show that using the results of the algorithm to generate MPI communications code can reduce the communications data and the speed-up ratio is close to manual MPI parallel program.
5. 基于嵌套循环分类的并行识别技术Parallelism Recognition Technology Based on Nested Loops Classifying 北大核心 CSCD CSTPCD
- 赵捷；赵荣彩；丁锐；黄品丰
- 摘要： Existing distributed memory parallelizing compiler systems are mostly developed based on shared systems. The parallelism recognition technologies of shared memory parallelizing compiler systems are suitable for OpenMP code generation. Their implementation is used to recognize all nested loops by the same technology, so that the parallelism cannot be efficiently explored when applying them to distributed memory parallelizing compiler systems. Thus, this paper proposes some parallelism recognition technologies suitable for the MPI code generation for distributed memory parallelizing compiler systems by classifying the nested loops according to their structures. To solve these problems, a new classification method of nested loops is proposed, according to the structure of nested loops and characteristics of MPI parallel program. Corresponding parallelism recognition technologies for different nested loops are also presented, respectively. The experimental results show that compared with the distributed memory parallelizing compiler systems that used existing parallelism recognition technologies, the compiler systems, which use the proposed classification method and the corresponding recognition technologies, can more efficiently recognize parallel nested loops in the benchmark programs, and the performance speedup of the MPI codes automatically increased to more than 20%.%传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高效发掘程序的并行性.分布存储并行编译系统应根据嵌套循环结构的特点进行分类处理,提出适合MPI代码生成的并行识别技术.为解决上述问题,根据嵌套循环的结构和MPI并行程序的特点,提出了一种新的嵌套循环分类方法,并针对不同的嵌套循环分别提出了相应的并行识别技术.实验结果表明,与采用传统并行识别技术的分布存储并行编译系统相比,按照所提方法对嵌套循环进行分类,采用相应并行识别技术的编译系统能够更高效地识别基准程序中的并行循环,自动生成的MPI并行代码其性能加速比提高了20％以上.
6. A FEATURE-BASED APPROACH FOR MINING PARALLELISABLE POINTS OF PROGRAM一种基于特征的程序可并行点发现方法北大核心 CSCD CSTPCD
- 郭慎；李培峰；朱巧明
- 摘要： Exploring parallelisable points of codes in program is the first step of parallel compiling technology. In this paper,we propose a novel method based on SVM to mine the parallelisable points in running program according to the features it uses to represent the parallelity of program, including program executing time, circulation partof program, data dependency analysis, and ratio of execution time and the times of circulation, etc. Experimental results show that the parallelisable points mined by our method meet the needs of practical application much better,and the mined points can get considerable performance speedup ratio after to be parallelised.%并行编译技术的首要问题就是程序中可并行点的发现.以程序执行时间、程序中的循环部分、数据依赖性分析以及程序执行时间与循环次数比等特征来表征程序的可并行性,并采用SVM根据以上特征进行程序中的可并行点的挖掘.实验证明,该方法更能符合实际应用的需要,发现的可并行点做并行化后有可观的性能加速比.
- 并行编译
- 数据依赖
- 特征
- SVM
7. On Advanced Compiler Courses for Graduated Students研究生编译课程教学探讨
- 黄春；赵克佳
- 摘要： With the rapid development of computer science,especially computer architecture,compiler technology is facing a huge challenge.Therefore,this needs us to strength the teaching of compiler technology and open advanced compiler courses for graduate students%随着计算机技术的不断发展,尤其是计算机体系结构的发展,编译器面临极大的挑战。这要求我们进一步加强和发展编译教学,在研究生阶段开设编译高阶课程。本文介绍国防科学技术大学研究生高级编译技术课程,包括课程内容、安排和实践,给出了国际其他大学开设研究生阶段编译课程的情况介绍。
8. 基于多线程LL(1)分析表自动生成的并行算法Design of Parallel Algorithm on Autogeneration of LL(1) Analytical Table CSTPCD
- 闫昭；刘磊
- 摘要：为解决编译系统工作中由于文法非终结符数量庞大造成的生成LL(1)分析表速度缓慢的问题,描述了多处理机环境下的LL(1)分析表自动生成的一种并行处理方法,并讨论了LL(1)分析表生成的并行算法的设计思想和实现策略.在采用LL(1)方法实现自顶向下语法分析的并行编译中,LL(1)分析表的生成一直处于关键地位,由于文法中的终结符和非终结符个数很多,分析表的构造成为提高语法分析速度的瓶颈问题,因此考虑采用LL(1)分析表的并行生成.算法采用多线程的工作模式,并借助于线程间的通讯机制实现,此并行处理方法对编译的并行处理和提高效率有理论和现实意义.
9. 消除冗余通信的暴露集求解算法Exposed-set Calculating Algorithm for Eliminating Redundant Communication 北大核心 CSCD CSTPCD
- 刘晓娴；赵荣彩；梁玲
- 摘要：针对分布存储结构计算机系统在并行编译过程中存在的问题,提出一种消除冗余通信的暴露集求解算法,分别采用数组数据流分析和自干扰分析技术对嵌套循环中的流依赖和输入依赖进行分析,从而得到暴露集空间.仿真实验结果表明,将该算法所得结果作为后端生成数据分布通信代码的依据,可有效消除冗余通信,提高系统整体性能.
10. 程序并行化中基于暴露集生成数据分布代码Generating data distributing code based on exposed-set for program parallelization 北大核心 CSCD CSTPCD
- 丁锐；赵荣彩；韩林
- 摘要：在并行化编译中,代码生成属于编译器的后端,决定着并行程序的执行效率.数据划分将计算循环中被重定义或没被读引用的数据映射到处理器,按照数据划分生成通信代码会产生冗余通信.提出了利用数组数据流分析求解暴露集,并建立计算划分、循环迭代以及暴露集的不等式限制系统,最后通过FME(fourier Motzkin elimination)消元生成数据分布代码的优化算法.测试结果表明该算法对数据分布的优化效果明显.

1. 一种交互式并行化编译系统及其编译方法
- 浙江大学
- 公开公告日期：2013.07.31
- 摘要：本发明涉及编译技术，提供了一种交互式并行化编译系统和编译方法，该系统和方法根据自动分析所得的信息，结合通过交互方式由用户提供的信息，形成程序的计算结构特性，针对不同的计算，采用不同的并行化方法实现源到源的并行化转换。本发明提供了友好的交互手段、使用户与编译器紧密协作、并结合最新的先进并行化技术、并使串行应用程序在多核体系结构下获得好的性能。
2. 多线程并行执行装置、广播流再现装置、广播流储存装置、储存流再现装置、储存流再编码装置、集成电路、多线程并行执行方法、多线程编译器
- 松下电器产业株式会社
- 公开公告日期：2015.10.07
- 摘要：在暂定数据保存部(104)中保存有值“3”和迭代号码“3”的情况下，在数据更新管理部(103)接收到与迭代号码“2”建立了联系的值“2”的情况下，数据更新管理部(103)通过将两迭代号码的大小关系比较，判断为不将接收到的信息覆盖到暂定数据保存部(104)中。然后，数据更新管理部(103)如果从多线程执行部(102)接收到表示并行执行的结束的结束信息，则将保存在暂定数据保存部(104)中的值“3”反映到确定数据保存部(105)中。
3. 一种交互式并行化编译系统及其编译方法
- 浙江大学
- 公开公告日期：2010-03-10
- 摘要：本发明涉及编译技术，提供了一种交互式并行化编译系统和编译方法，该系统和方法根据自动分析所得的信息，结合通过交互方式由用户提供的信息，形成程序的计算结构特性，针对不同的计算，采用不同的并行化方法实现源到源的并行化转换。本发明提供了友好的交互手段、使用户与编译器紧密协作、并结合最新的先进并行化技术、并使串行应用程序在多核体系结构下获得好的性能。
4. 并行程序的生成方法以及并行化编译装置
- 学校法人早稻田大学
- 公开公告日期：2018-07-06
- 摘要：本发明提供一种并行程序的生成方法。由并行化编译装置(100)执行的并行程序的生成方法包括下述融合步骤：将包括具有条件分支的任务的基准任务和后续任务的任务组融合成新任务，其中，该后续任务是相对于基准任务中包含的条件分支的所有分支方向具有控制依赖性、扩展控制依赖性或间接控制依赖性的任务(图2/步骤026)。利用本发明的并行程序的生成方法，能够生成在不损害抽取并行性的可能性的情况下进行静态调度的并行程序。
5. 多线程并行执行装置、广播流再现装置、广播流储存装置、储存流再现装置、储存流再编码装置、集成电路、多线程并行执行方法、多线程编译器
- 松下电器产业株式会社
- 公开公告日期：2012-05-09
- 摘要：在暂定数据保存部(104)中保存有值“3”和迭代号码“3”的情况下，在数据更新管理部(103)接收到与迭代号码“2”建立了联系的值“2”的情况下，数据更新管理部(103)通过将两迭代号码的大小关系比较，判断为不将接收到的信息覆盖到暂定数据保存部(104)中。然后，数据更新管理部(103)如果从多线程执行部(102)接收到表示并行执行的结束的结束信息，则将保存在暂定数据保存部(104)中的值“3”反映到确定数据保存部(105)中。
6. 跨平台GPU并行计算框架、代码编码、编译方法及设备
- 影石创新科技股份有限公司
- 公开公告日期：2022-03-25
- 摘要：本发明适用于计算机技术领域，提供了一种跨平台GPU并行计算框架、代码编码方法、代码编译方法、设备及存储介质，该跨平台GPU并行计算框架封装有第一API、第二API以及语言编译模块，其中，语言编译模块用于将第一着色语言代码编译为第二着色语言代码，从而通过该跨平台GPU并行计算框架实现多平台代码的转换，提高了软件开发效率，并保证了跨平台代码的一致性。
7. 基于并行耦合极化码编译码方法
- 重庆邮电大学
- 公开公告日期：2022-01-04
- 摘要：本发明提供了一种基于并行耦合极化码编译码方法。该方法在编码端，设计了一种新的编码方案，每帧信息比特部分根据信道可靠性划分为三部分，高可靠信息比特位集合A、较高可靠信息比特位集合B和一般可靠信息比特位集合C，且集合B和C的比特位数相等。将多个编码帧的较高可靠信息比特位和一般可靠信息比特位进行循环耦合。译码端首先对每帧采用CRC辅助的SCL(CRC‑aided SCL，CA‑SCL)译码，将译码结果满足CRC校验的帧视为译码成功，否则视为译码失败。若全部帧均译码成功就退出译码，否则利用帧间相关性，对译码失败的帧，根据译码出现的三种情况：非连续帧译码失败、连续两帧依次译码失败、连续三帧或三帧以上依次译码失败，采用帧间比特替换与比特比较相结合的方法，通过译码成功的帧辅助译码失败的帧进行纠正译码，从而提高极化码的纠错性能。
8. 一种并行预编译方法及系统
- 上海聚水潭网络科技有限公司
- 公开公告日期：2022-08-05
- 摘要：本发明涉及一种并行预编译方法及系统，涉及应用程序编译发布技术领域，方法包括：获取预编译源码；对所述预编译源码进行预处理，以得到多组预编译数据；将各组所述预编译数据存储于不同的工作区；根据每组所述预编译数据及其对应的工作区，基于DLL编译创建链接地址；根据每组所述预编译数据对应的链接地址，对多组所述预编译数据同时进行预编译，得到预编译结果。本发明提供的技术方案大大提高了预编译速度。
9. 分布式编译的并行实时仿真系统和仿真方法
- 中国航发商用航空发动机有限责任公司
- 公开公告日期：2022-07-08
- 摘要：本发明提供了一种分布式编译的并行实时仿真系统和仿真方法，包括：建模计算机，适于完成图形化建模并生成模型源代码和库文件；仿真机客户端计算机，适于提供远程登录的客户端并提供远程操控指令；自动测试计算机，适于完成测试用例的编制，并提供测试用例和测试控制脚本；以及仿真计算机，包括仿真控制及运行环境SCRE和仿真机运行环境调度机，适于根据模型源代码和库文件生成Model可执行文件，并完成仿真测试。本发明的仿真系统和仿真方法优化了仿真集成环节的专业布局，提升了仿真系统分工集成效率，改进了开展仿真试验的质量和工作效率。
10. 一种源码并行编译方法及系统
- 中电信数智科技有限公司
- 公开公告日期：2022-09-13
- 摘要：本发明涉及一种源码并行编译方法及系统,属于计算机技术领域。方法包括以下步骤：master结点确定各个编译模块之间的依赖链，遍历所述依赖链，确定出所述依赖链上的结点；master结点根据确定出的所述依赖链上的结点中的模块信息下发编译任务给对应的s l ave结点，一个s l ave结点对应于一个编译模块；各个编译模块对应的s l ave结点同时开始编译任务。本方法能够自动解决模块之间的依赖问题，并提取出可以并行编译的模块进行并行编译，提高软件编译效率，降低编译的时间成本，加快软件开发和测试的进度。

并行编译

并行编译—发文量

并行编译—发文趋势图

并行编译-研究学者

并行编译-相关主题

并行编译-相关期刊

并行编译-相关会议

并行编译
-研究学者

并行编译
-相关主题

并行编译
-相关期刊

并行编译
-相关会议