并行技术
并行技术的相关文献在1990年到2022年内共计118篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、化学工业
等领域,其中期刊论文93篇、会议论文17篇、专利文献167770篇;相关期刊83种,包括科技和产业、信息系统工程、中国管理信息化等;
相关会议16种,包括中国地球物理学会第二十九届年会、第二届中国科学院超级计算应用大会(SCA2012)、2012全国高性能计算学术年会等;并行技术的相关文献由258位作者贡献,包括党向盈、姜代红、李明雨等。
并行技术—发文量
专利文献>
论文:167770篇
占比:99.93%
总计:167880篇
并行技术
-研究学者
- 党向盈
- 姜代红
- 李明雨
- 杨萍
- 毕义明
- 赵伟
- 鲍蓉
- 余宗萍
- 刘跃波
- 吴鸿伟
- 孙臻
- 宋靖宇
- 宛汀
- 张光斌
- 张昀
- 李丽
- 李伟
- 李永清
- 李胤
- 桃子
- 殷凯
- 江泰廷
- 沈建新
- 王天凌
- 罗子玉
- 胡志刚
- 胡越欣
- 范师尧
- 袁锋
- 谢维盛
- 谭睿璞
- 雷斐
- 韩晓冰
- 黄海玉
- 龙剑
- BAO Rong
- Byamugish Fred
- Byamugisha Fred
- CHANG Jin-yi
- Chen Wei
- DANG Xiang-Ying
- Deng Sungen
- GUO Li-xin
- Hamed Dinari
- Hassan Naderi
- JIANG Dai-Hong
- LIU Wei
- LIU Yu-Hang
- Liu Fang
- Marian Stofka.
-
-
葛亮;
蒋炎;
张禾;
邓勇;
肖小汀;
薛志波;
张嘉伟
-
-
摘要:
为了高效利用CPU资源并满足多任务调度测试和并行技术需要,以核磁测井仪器的多线程优化问题为研究对象进行建模研究。该研究首先分析了基于LabVIEW的多线程优化机理,详细分析了常用的优化机制;其次设计了核磁测井仪器的多线程优化模型,并分析了优化模型内各种线程的功能和关系;最后,通过多线程优化模型开发出高温多维核磁测井仪器软件(EMRT2.0),并与一维核磁测井仪器软件(EMRT1.0)进行对比试验测试。实验结果表明,EMRT2.0将EMRT1.0的测试周期缩短为原周期的1/2,CPU的利用率从0.4%~1.5%提升到1.4%~6.2%,MATLAB的CPU利用率和物理内存占用降至0。研究实现的多线程优化模型能高效地利用CPU资源对核磁测井仪器进行多任务调度和并行测试。
-
-
-
-
-
-
殷凯
-
-
摘要:
目前,我国的软件技术正向着数字化和超智能化发展.特别是雷达的软件和数字化技术变得越来越明显,软件雷达是一种采用开放式的通用平台,通过生活中实际的模拟运算加载来实现各种远程任务.正因为软件雷达拥有各种功能,而且具有多模式多结构并行运算的发展潜力.通过这些技术的革新,让GPU在并行运算中发挥重要的作用.
-
-
赫凌俊;
李宁波;
张妍;
陈静
-
-
摘要:
电大、超电大尺寸目标电磁建模在实际工程中具有重要的意义.电磁建模过程中需要海量的计算内存与时间,如何利用高性能计算集群,实现高性能电磁计算是当前急需解决的问题.本文通过并行多层快速多极子技术,能够快速并行的构造近场数据和远场数据,并通过并行求解技术来加速线性方程组迭代求解收敛的速度.论文对多层快速多极子方法的大规模并行计算策略的研究,可以显著提高电大尺寸目标电磁建模的效率.数值仿真结果证明当未知量的规模达到1500多万时,仍然可以取得显著的并行加速效果,证明了本文提出的并行计算方案的有效性.
-
-
殷凯
-
-
摘要:
目前,我国的软件技术正向着数字化和超智能化发展。特别是雷达的软件和数字化技术变得越来越明显,软件雷达是一种采用开放式的通用平台,通过生活中实际的模拟运算加载来实现各种远程任务。正因为软件雷达拥有各种功能,而且具有多模式多结构并行运算的发展潜力。通过这些技术的革新,让GPU在并行运算中发挥重要的作用。
-
-
杜秀丽;
江焕承;
陈波;
邱少明
-
-
摘要:
针对现有自适应滤波算法中数据处理效率低的问题,提出了基于并行技术和流水线的最小均方误差(Least mean square,LMS)自适应滤波算法.该算法构建基于并行技术的多输入多输出滤波器结构,成倍提高系统滤波处理速度;设计基于流水线的LMS自适应滤波权系数求解方法,有效改善了权系数计算效率.最后利用现场可编程门阵列(Field programmable gate array,FPGA)对该算法进行了验证,结果表明,对于四级并行流水线四阶LMS自适应滤波器,其数据处理速率提高了约8倍,在相同的数据处理速率下,其功耗可降低约84%,从而提高了LMS自适应滤波处理速率,降低了系统功耗,实现了高速、超高速数据流的实时自适应滤波处理.%To increase low efficiency of handling high-speed data in existing adaptive filter algorithms,an least mean squarse(LMS) adaptive filter algorithm based on parallel technology and pipeline is proposed.The proposed algorithm accelerates data processing speed to improve the speed of weight coefficient computing significantly,and reduces the critical path to improve the system working clock effectively.In the experiment based on FPGA,for the LMS adaptive filter based on 4-channel parallel structure and 4-stage pipelines,its data processing rate increases by eight times,and the power consumption can be reduced to 16%,with the same rate of data processing.It can thus realize the real-time LMS adaptive filtering process of high-speed or hyper-speed data stream.
-
-
陈辉焱;
刘乐;
杨毅
-
-
摘要:
实践中对于高维的最佳格基规约算法是Schnorr-Euchner的BKZ.格密码体制的所有安全估计都是基于BKZ的NTL来实现的,但随着维数的增加,格基规约算法的运行时间会急剧增加.最近关于格计数的进展表明,BKZ和NTL的实现不再是最优的,但对于安全性估计的确切影响还不清楚.用BKZ的并行技术来评估这种影响是一种比较好的方法.为了降低格基约化算法的运行时间,提出了一种高效的并行算法来模拟高维情况下块长度≥50的BKZ行为,这可以近似预测输出质量及其运行时间,从而修正格安全的估计.%The best lattice basis reduction algorithm known in practice for high dimensions is Schnorr-Euchner's BKZ.All security estimates of lattice cryptosystems are based on NTL's implementation of BKZ.With the increase of dimension,the time cost of lattice basis reduction algorithms will increase rapidly.Recent progress on lattice enumeration suggests that BKZ and NTL implementation are no longer optimal,but the precise impact on security estimates is unclear.To evaluate the effect with the parallel technology of BKZ is a better method.In order to reduce the running time of lattice basis reduction,this paper proposed an efficient parallel algorithm to simulate the behavior of BKZ in high dimension with high block size ≥50,which could predict approximately both the output quality and the running time.
-
-
-
Chen Wei
- 《2016年全国高性能计算学术年会》
| 2016年
-
摘要:
本文简要介绍了如何通过MPI分布式并行技术与PThread多线程技术协同工作,对三维地震数据叠前随机噪声衰减程序进行优化.节点间使用MPI分布式并行,节点内使用多线程共享内存及流水线方式.在主进程中增加了一个加权线程用于对来自各个计算节点的结果数据进行加权,一个临时数据输出线程负责将临时数据输出到临时磁盘文件中,一个最终地震数据输出线程负责将合并后的地震数据输出到地震处理系统中.在从进程中,增加了FFT处理线程、RNA计算线程和IFFT处理线程,线程个数取决于节点上的CPU核数.除此之外,主进程对任务的分配采用动态调度方式,对从进程的任务请求采用先来先服务的原则.通过MPI/多线程协同工作技术,实现了数据I0、通讯、计算的异步操作,缩短了任务等待数据的时间,提升了计算效率。
-
-
ZHANG Tao;
张涛;
GUO Li-xin;
郭立新;
LIU Wei;
刘伟
- 《2015年全国微波毫米波会议》
| 2015年
-
摘要:
本文中,引入基于OpenGL(开放图形库)的遮挡判断算法来提高IPO(迭代物理光学法)的遮挡判断效率,并基于OpenMP(开放多处理)的并行技术,将表面电磁流迭代的循环遍历分配到多个线程中,以提高IPO的迭代效率.利用该方法计算所得结果与传统算法得到的结果相比,在不影响计算精度的同时,效率显著提升.因此,利用基于OpenGL消隐的并行IPO可以较高效地计算分析电大尺寸粗糙面与目标的复合电磁散射特性.
-
-
谢建军;
胡天跃
- 《中国地球物理学会第二十九届年会》
| 2013年
-
摘要:
地震波正演模拟技术是模拟复杂近地表低速带和地质构造深部精细结构的有效方法,可以较为全面地反映地震波场在介质中的分布和传播规律.随着油气勘探程度的不断提高,三维勘探技术趋向成熟,逐渐面向生产需求.三维勘探中,传统的正演模拟方法在应用中面临计算量大、内存占用高的问题,提高计算效率就成为需要考虑的因素.本文应用GPU并行技术,对交错网格有限差分算法进行优化,并利用该方法实现三维弹性波正演模拟.首先对三维French模型进行正演模拟,记录传播过程中的波场情况及叠加剖面,与他人的结果(裴正林,2005)进行对比,验证计算的正确性。对实际碳酸盐岩介质的微裂缝储层进行正演模拟,波场快照中可以观测到能量在裂缝间和裂缝层内的传播,分析结果可知裂缝的存在会引起地震记录的反射波振幅能量、相位和到达时问的改变。本方法对于复杂的地下结构弹性波正演有很好的模拟效果。通过GPU并行加速,与CPU版本对比,提速数十倍,很好的提高了计算效率。
-
-
-
DANG Xiang-Ying;
党向盈;
BAO Rong;
鲍蓉;
JIANG Dai-Hong;
姜代红
- 《2012全国高性能计算学术年会》
| 2012年
-
摘要:
借鉴无损压缩编码中的GAP和GED预测器模板,改进该模版并应用在图像边缘检测中,提出一种新颖的基于多方向梯度边缘预测器(MGEDP)模板的动态阈值控制的边缘检测算法.以图像中心划分四个区域,采用并行技术同时多个方向应用MGEDP预测器模板,分别预测错误值;利用错误反馈信息构建预测误差图像;然后利用大津算法(OTSU)计算阈值;分类误差图像边缘;细化边缘,最后合成边缘图像.实验证明,该算法应用并行技术不仅大大降低了时间复杂度,模板以中心逐步向四周选择预测参考点,避免误差繁衍,得到清晰完整,细节丰富的边缘图像.
-
-
张光斌;
谢维盛;
吴鸿伟
- 《第26次全国计算机安全学术交流会》
| 2011年
-
摘要:
文章以经典的多模式匹配算法—AC算法为例,通过对CUDA特性的分析,提出了基于CUDA的并行模型,设计了适合CUDA并行技术的AC匹配算法。实验结果表明,基于CUDA的AC匹配算法较CPU上获得了22倍的加速比,有效提高了入侵检测系统的性能。
-
-
-
Liu Fang;
刘芳;
Deng Sungen;
邓笋根;
Nie Ningming;
聂宁明;
Wang Yangang;
王彦棡;
Wang Jue;
王珏
- 《第二届中国科学院超级计算应用大会(SCA2012)》
| 2012年
-
摘要:
本文介绍了二维/三维克希霍夫时间偏移计算在GPU集群上的MPI/CUDA混合编程实现.系统的主体结构基于经典的主从模式,采用MPI进程-pthread线程-CUDA线程三个层次的并行架构,以及CPU/GPU协同计算并行架构和策略来设计实现.每个计算节点由一个多核CPU和多个GPU设备组成.输入数据在主节点上载入,平均分配到从节点上,存储到相应的磁盘空间内,并根据各节点的可用资源将数据划分为多块.每个从节点分别接收主节点发送的数据并存储到本地磁盘上的临时文件内.根据检测到的可用GPU设备数,每个从节点上创建同样数目的线程来一对一控制各个GPU.各从节点上每个数据块再进一步划分为大小相等的块一一分配给各个线程,由每个线程逐道在CPU上预处理后传送到GPU上处理,道内的各成像点分别由各CUDA线程并行处理.每个数据块偏移由每个线程内的相关道累加计算而得,结果返回到主节点上累加后输出到磁盘文件内.在实现过程中,采用CPU/GPU协同计算以及线性插值走时的方式来进一步提高性能.系统性能在一典型异构GPU集群上测试,每个节点由一个配置8GB内存的四核CPU,以及配置6GB显存的C1060型号的GPU组成.对于不同的规模和积分计算模式,在该平台上的测试结果表明,本文实现的系统的性能对于包含相同计算节点数、每个节点上4个线程并行计算的MPI版本,可以达到平均约5~10倍的加速.
-
-
Liu Fang;
刘芳;
Deng Sungen;
邓笋根;
Nie Ningming;
聂宁明;
Wang Yangang;
王彦棡;
Wang Jue;
王珏
- 《第二届中国科学院超级计算应用大会(SCA2012)》
| 2012年
-
摘要:
本文介绍了二维/三维克希霍夫时间偏移计算在GPU集群上的MPI/CUDA混合编程实现.系统的主体结构基于经典的主从模式,采用MPI进程-pthread线程-CUDA线程三个层次的并行架构,以及CPU/GPU协同计算并行架构和策略来设计实现.每个计算节点由一个多核CPU和多个GPU设备组成.输入数据在主节点上载入,平均分配到从节点上,存储到相应的磁盘空间内,并根据各节点的可用资源将数据划分为多块.每个从节点分别接收主节点发送的数据并存储到本地磁盘上的临时文件内.根据检测到的可用GPU设备数,每个从节点上创建同样数目的线程来一对一控制各个GPU.各从节点上每个数据块再进一步划分为大小相等的块一一分配给各个线程,由每个线程逐道在CPU上预处理后传送到GPU上处理,道内的各成像点分别由各CUDA线程并行处理.每个数据块偏移由每个线程内的相关道累加计算而得,结果返回到主节点上累加后输出到磁盘文件内.在实现过程中,采用CPU/GPU协同计算以及线性插值走时的方式来进一步提高性能.系统性能在一典型异构GPU集群上测试,每个节点由一个配置8GB内存的四核CPU,以及配置6GB显存的C1060型号的GPU组成.对于不同的规模和积分计算模式,在该平台上的测试结果表明,本文实现的系统的性能对于包含相同计算节点数、每个节点上4个线程并行计算的MPI版本,可以达到平均约5~10倍的加速.