并行程序
并行程序的相关文献在1988年到2022年内共计335篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、工业经济
等领域,其中期刊论文189篇、会议论文66篇、专利文献120346篇;相关期刊88种,包括管理观察、西北工业大学学报、计算机工程等;
相关会议43种,包括第15届全国软件与应用学术会议(NASAC2016)、2016年全国高性能计算学术年会 、2014全国高性能计算学术年会等;并行程序的相关文献由711位作者贡献,包括田甜、巩敦卫、姚香娟等。
并行程序—发文量
专利文献>
论文:120346篇
占比:99.79%
总计:120601篇
并行程序
-研究学者
- 田甜
- 巩敦卫
- 姚香娟
- 郑纬民
- 钱德沛
- 翟季冬
- 陈文光
- 刘轶
- 武林平
- 王敬宇
- 莫则尧
- 党向盈
- 冯晨
- 冯赟龙
- 刘勇
- 刘志勇
- 孙川
- 宋佳伟
- 应欢
- 张伟哲
- 张威
- 张延园
- 彭达佳
- 李云春
- 杨秀婷
- 梁艳
- 王子鸣
- 王锐
- 王鼎兴
- 罗威
- 郑炜
- 陈军
- 陈华蓉
- 黄月明
- 齐尧
- Cao Zongyan
- 何慧
- 刘旭
- 刘晓平
- 刘键
- 卢凯
- 吴潇雪
- 周旭
- 唐博文
- 唐士斌
- 宋君强
- 宋风龙
- 崔焕庆
- 廖湘科
- 张辰
-
-
张思松
-
-
摘要:
网络用户大幅度增加为网络发展带来机遇的同时也带来了挑战,当前使用的数据负载均衡方法节点数据分发能力较差导致网络节点吞吐量较低。因此,设计了基于深度强化学习算法的高能效数据负载均衡方法。选择隐式并行程序设计方法,设计网络数据并行程序。根据存储节点个数,设计数据分配与迁移方法。根据存储节点数据量与特征,选择深度强化学习算法,实现高能效数据负载均衡。构建仿真分析环节,经多次测试证实,深度强化学习负载均衡方法具有调节网络节点平均吞吐量的能力,且此方法的使用效果优于当前所使用的其他方法。
-
-
张杨;
李柳旭
-
-
摘要:
针对并发程序中锁的不当使用可能导致性能瓶颈的问题,提出检测和优化并发程序中同步瓶颈的方法IdeSync。IdeSync使用静态分析方法获取同步方法和同步块,构建静态同步依赖图,采用基于执行路径的动态分析技术进行同步依赖关系分析,构建同步依赖图。为了暴露性能瓶颈,在同步依赖图上通过增加程序工作负载的方式,监测临界区的性能变化,并针对检测到的同步瓶颈给出优化建议。在实验中通过HSQLDB、SPECjbb2005和RxJava等12个大型实际应用程序对IdeSync的有效性进行验证,共检测到72个同步瓶颈,根据优化建议进行优化后程序性能均有所提升。实验表明,IdeSync能够有效地检测和优化同步瓶颈。
-
-
黄海洋
-
-
摘要:
传统的多道并行程序数据召测模型对于病毒的抵御能力较差,导致安全系数较低.为此,基于NB-IoT研究了一种新的多道并行程序数据召测模型.首先分析NB-IoT技术的实现机制,并结合无线网络确定传输机制,引入5个不同的运行线程,与节点匹配包并行服务.同时,利用NB-IoT技术对每个进程进行隐形缓存,缓解计算机处理器的存储空间.多道并行程序可以直接通过共享内存间的数据拷贝来实现,因此线程间的数据通信效率很高,且可以有效地避免网络通信带来的延迟.基于此,利用基于线程的编程方式更好地发挥数据召测的性能,通过初始运行、程序操作、确定程序数据格式、召测信息输出完成召测.实验结果表明,该模型能够有效提高病毒抵御能力,增强安全系数.
-
-
张辰;
田甜;
杨秀婷;
巩敦卫
-
-
摘要:
针对通信规模的增大及不确定通信使得消息传递接口(MPI)并行程序通信测试难度增大的问题,提出了基于占优关系的通信覆盖约减方法.首先,基于通信与通信语句间的对应关系,将通信约减问题转换为通信语句的约减问题;然后,利用语句占优关系求解通信语句集的约减集;最后,选择与约减集相关的通信作为覆盖目标,使得覆盖这些目标的测试数据能够覆盖全部通信.将所提方法应用到7个典型被测程序中.实验结果表明,在不降低通信覆盖率的前提下,相较于以全部通信作为覆盖目标的测试数据生成方法,所提方法减少的测试数据的生成时间最高达95%,提高了通信覆盖测试数据生成的效率.
-
-
王婧
-
-
摘要:
多核CPU的存储层次越来越深而且越来越复杂,这已经成为优化大规模并行应用程序性能的关键瓶颈.目前并行程序设计语言和多核CPU有两种局部性设计方法,一个是横向局部性,另一个是纵向局部性,通过这两种视角可以进一步了解现在并行程序设计语言中局部性机制的特点.文章就并行程序设计语言中局部性机制进行探讨,深入分析其优缺点,探究未来并行程序设计语言设计的方向,指出新语言可以考虑这两种局部性设计机制,希望能为相关从业者带来一些参考.
-
-
张灿恒;
蒋欣欣;
周航;
赵宏伟;
张杨;
刘新焕
-
-
摘要:
为了实现并行程序的过程重现复现初始执行时的错误,对源程序进行词法语法分析,在此基础上建立确定性复现所需的信息模板;基于信息模板通过插桩技术实现基于时间和事件混合触发的记录,并设计自适应动态采样周期和记录信息约简方法;基于混合触发实现程序执行时序的确定性以及初始输入的确定性记录,并在Eclipse环境下实现相应的并行程序过程重现插件.试验验证混合触发的记录方式在回放的一致性、记录阶段的开销方面比现有的单一触发具有较好的优势.%In order to realize the process reproduction of the parallel program to reproduce the error during the initial execution, firstly, the lexical and grammatical analysis of the source program is performed, and the information template required for deterministic recurrence is established on the basis of the information template. Next, the recording mode based on time and event hybrid triggering is realized by the instrumentation technique. And design adaptive dynamic adoption of cycle and record information reduction methods. Then, based on the hybrid trigger, the determinism of the execution timing of the program and the deterministic record of the initial input are implemented, and the corresponding parallel program process reproduction plug-in is implemented in the Eclipse environment. Finally, it is verified by experiments that the hybrid recording method proposed in this paper has better advantages in terms of playback consistency and recording stage overhead than the existing single trigger recording method.
-
-
周世康;
蒋欣欣;
周航;
姚蕊;
张灿恒
-
-
摘要:
并行程序的应用在提高程序运行效率的同时,也带来了不确定性的错误.这种错误往往难以复现,传统的调试工具越发难以满足并行程序的调试需求.据此提出了一种面向并行程序错误检测以及确定性回放的方法,针对并行程序中容易发生的数据竞争、死锁、原子性违反这几类错误进行检测判断;对并行程序的运行进行插桩以保证程序重复执行时的次序一致.在此理论基础上设计实现了Eclipse插件.通过试验,该工具可以对并行程序易发的错误进行有效的检测判断,较大程度地减少程序调试的工作量.
-
-
季晓枫;
宋昶衡;
李弋
-
-
摘要:
随着多核处理器的发展,大规模并行程序已经成为了主流.然而与单线程程序不同,并行程序并不能保证程序每次执行的路径都相同.路径不确定性却给程序的性能评估和错误调试带来了许多问题和挑战.而Java虚拟机本身的即时编译,垃圾收集等机制,更是加剧了程序的不确定性.如何解决不确定性的影响,一直是性能评估和错误调试两个领域的重要课题.从这两个方面,分别对处理Java并行程序不确定性的方法进行分析和总结.在此基础上,进一步比较了各项技术的优劣,也对性能评估和确定性重放两项技术的可能发展方向进行了展望.
-
-
朱越;
蒋蓉;
邵蓉
-
-
摘要:
澳大利亚自2011年起实行药品注册与医保准入并行程序,允许同时对药品进行注册评估与医保准入评估,保证了药品进入医保目录的及时性.通过对澳大利亚药品注册与医保准入并行程序的基本内涵、管理机构、实施流程及主要成效以及澳大利亚药品注册与医保准入进行研究,以期为我国医保目录管理提供参考与借鉴.
-
-
应欢;
刘松华;
唐博文;
韩丽芳;
周亮
-
-
摘要:
针对基于页保护机制的确定性重放方法虽然能够有效降低记录开销,但由于页保护异常仍会引入性能开销的问题,本文深入研究了共享页面访问权限释放同步点对并行程序记录性能的影响,提出了一种基于自适应释放策略的确定性重放方法.采用PARSEC测试集进行性能评估,实验结果表明,该方法能够更进一步降低记录开销.
-
-
-
ZHENG Wei;
郑炜;
FENG Chen;
冯晨;
WU Xiao-xue;
吴潇雪;
HUANG Yue-ming;
黄月明;
FANG Jing-yun;
方靓芸
- 《第15届全国软件与应用学术会议(NASAC2016)》
| 2016年
-
摘要:
并行程序测试中,测试输入和线程交互时序是影响并行错误检测的两个关键因素,论文以缩减并行错误检测的输入空间为目标,给出一种基于变异测试的测试用例最小化算法.首先对并行程序进行研究,选取与并行错误密切相关的9个变异算子并以此为基础为待测程序生成多种变异体;采用JPF作为线程调度工具来执行测试用例,根据变异评分与平均时间成本进行对测试用例进行排序,在优化后的测试用例集中选取检测能力不重复的测试用例,从而得到面向并行错误检测的最小测试用例集.实验结果证明,该方法能有效减小测试用例集规模,并大幅缩短运行时间,从而提高并行程序测试效率.
-
-
Hao Meng;
郝萌;
Zhang Weizhe;
张伟哲;
Lu Gangzhao;
鲁刚钊;
Han Shuo
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
并行程序性能预测技术在高性能计算领域发挥着重要的作用,例如,并行系统设计、并行程序优化和高性能机器选购等等.而基于大规模并行系统的准确和高效的并行程序性能预测是一个具有挑战性的问题.为了解决这个问题,本文基于LLVM编译器设计了一个性能预测框架,基于该框架能够在并行系统的少量节点上预测并行程序的执行性能,而不需要完整的执行该并行程序.该框架是将程序的串行计算部分和通讯部分分别进行建模,然后将这两部分的预测结果合并得到并行程序最终的预测结果.对于串行计算部分,本文将静态分支概率和循环次数相结合,提出一种轻量级的插桩方法来获取程序中各类指令的数量,然后构建测试程序来获取相应类型的指令的平均执行时间.为了使预测能够在单个计算节点的进行,利用删减技术将并行程序转化成相应的串行程序.对于通信部分,利用LogGP模型对点对点通信进行建模,然后利用人工神经网络对复杂的集合通信进行建模.基于NPB基准测试程序和并行应用CGPOP在实际的大规模并行系统中进行实验,验证方法的有效性.实验结果显示,该框架能够比较准确的预测并行程序的执行性能,所有实验程序的平均误差为10.86%.
-
-
ZHOU Ling-liang;
周领良;
ZHU Yan-chao;
朱延超;
LIU Yi;
刘轶;
QIAN De-pei;
钱德沛
- 《2014全国高性能计算学术年会》
| 2014年
-
摘要:
在用小规模宿主机系统执行并行程序来预测其在大规模目标系统上的性能时,由于单个宿主节点上运行的进程多于单个目标节点上运行的进程,导致进程的cache命中率与其在目标系统上实际运行的cache命中率存在一定差异,从而对并行程序性能的预测精度产生影响.本文针对该问题,提出了一种基于cache命中率校准的方法,该方法调整进程在宿主系统上的分布,指定一个校准节点,使该节点上运行的进程数和目标节点上的进程数相同,以获得准确的cache命中率,并用来校准其他宿主节点上进程的cache命中率,以提高并行程序性能预测的精度.实验结果表明,该方法可以有效地提高并行程序的性能预测精度.
-
-
-
YANG Chao;
杨超;
CHENG Tangpei;
程汤培;
DENG Li;
邓力;
FU Yuanguang;
付元光
- 《中国原子能科学研究院第32 届“五四”青年学术报告会》
| 2018年
-
摘要:
屏蔽计算是反应堆设计的重要环节之一,其计算结果直接影响核系统的寿命以及周边环境的辐射安全.JSNT是由中物院高性能数值模拟软件中心自主研发的三维离散纵标(SN)中子/光子输运程序,采用区域分解实现大规模并行,具有较高的计算精度和计算效率.本文利用JSNT对HBR-2装置进行屏蔽计算,分析了辐照监督管处和中子剂量测量仪处的中子通量密度分布以及6个核素的放射性比活度,并与实验测量值进行了比较,发现网格划分对计算结果有较大影响,随着网格的加密,计算结果趋于实验值;除在中子剂量测量仪处的237Np(n,f)137Cs和238U(n,f)137Cs外,计算结果与测量值的相对偏差均小于20%,满足工程要求.
-
-
WANG Jialong;
王家龙;
LIU Yanhong;
刘艳红;
SHEN Li;
沈立
- 《第15届全国软件与应用学术会议(NASAC2016)》
| 2016年
-
摘要:
虽然线程级猜测(Thread Level Speculation,TLS)执行机制可以简化多线程编程模型接口,并能获得较高的性能加速,但其并行程序的开发仍然比较困难.面向一个高效的软件TLS模型HEUSPEC,研究了代码自动生成工具C2H的设计与实现方法.具体包括三部分内容:首先为HEUSPEC设计了简单的标注语句,标注出可并行段的一些特征.其次,提出了将标注语句和可并行段转换为猜测线程函数的算法.最后设计了生成HEUSPEC并行代码的算法.该方法已在开源编译器Clang上实现.面向Rodinia、OmpScr等基准程序的测试结果表明,C2H能够将带有简单标注语句的串行C代码转换为HEUSPEC并行代码,且其性能与手工生成的HEUSPEC并行代码十分接近.
-
-
-
武林平;
Wu Linping;
魏勇;
Wei Yong;
徐小文;
Xu Xiaowei;
刘旭;
Liu Xu
- 《2013全国高性能计算学术年会》
| 2013年
-
摘要:
尽管系统噪音对单个进程的影响有限,但对于大规模并行程序性能的影响不容忽视.本文提出一种基于并行程序计算通信特征的噪音影响定量评估方法FWQ—MPI,并给出噪音影响的四个量化指标:噪音量比例、噪音影响比例、实际计算通信时间比、理想计算通信时间比.根据该方法,选取求解稀疏线性代数方程组的三种迭代方法作为研究对象,抽取迭代方法的计算特征、同步通信特征形成微测试程序;在一台包含512个双路六核计算结点的并行机上运行该微测试程序,测试数据明确了系统噪音对并行程序性能的影响机理,并得到系统噪音对并行程序性能影响的若干规律;BSP并行程序运行过程中,系统噪音量比例不大,约占整个计算时间的2%~6%;但系统噪音对BSP并行程序的性能有着较大的影响(当并行规模在1024、2048、4096时,噪音影响比例约为30~70%);系统噪音的影响随着并行程序规模的扩大而增加,随着两次同步通信间隔内计算量的增加而降低;系统噪音的影响主要体现在BSP并行程序的“实际计算通信时间比”要远小于“理想计算通信时间比”.
-
-
-
-
-
-
- 无锡江南计算技术研究所
- 公开公告日期:2022.09.13
-
摘要:
本发明公开一种基于层树网络的大规模并行程序性能数据快速收集方法,包括以下步骤:S1、依据计算节点启动的进程最多能使用的端口号数目限制M,确定子收集节点所需负责的子节点数目m;S2、根据S1中获得m值,将所需采集性能数据的总进程数N划分为一个各个树层并行度相当的拓扑网络;S3、分析各个树层的数据传输效率比1:η1,η2,...,ηh‑1,其中h为树的深度;S4、根据S3中各个树层的数据传输效率比,实现对拓扑网络的优化;S5、通过socket建立层树收集网络,实现对性能数据的收集。本发明针对异构众核结构特征,结合异构众核处理器的特点,将部分收集进程下沉至计算节点上,并且结合各树层的数据传输效率对树型收集网络进行拓扑优化,能够实现大规模并行程序性能数据的快速收集。
-
-
-
-
-
-