您现在的位置: 首页> 研究主题> 并行计算

并行计算

并行计算的相关文献在1985年到2023年内共计5838篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术 等领域,其中期刊论文4485篇、会议论文828篇、专利文献388631篇;相关期刊1134种,包括计算机工程、计算机工程与科学、计算机工程与设计等; 相关会议446种,包括2014全国高性能计算学术年会、2012全国高性能计算学术年会、2011年全国高性能计算学术年会(HPC china2011)等;并行计算的相关文献由12078位作者贡献,包括莫则尧、金先龙、迟学斌等。

并行计算—发文量

期刊论文>

论文:4485 占比:1.14%

会议论文>

论文:828 占比:0.21%

专利文献>

论文:388631 占比:98.65%

总计:393944篇

并行计算—发文趋势图

并行计算

-研究学者

  • 莫则尧
  • 金先龙
  • 迟学斌
  • 宋君强
  • 李晓梅
  • 陆忠华
  • 刘杰
  • 李涛
  • 陈勇
  • 张理论
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 李姗姗; 骆开达; 卫守林; 戴伟; 梁波
    • 摘要: 快速傅里叶变换(Fast Fourier Transform,FFT)比傅里叶变换有更好的算法性能,是射电干涉成像的基础算法,但因为天线阵列的不规则采样,需使用网格化算法将可见度数据重采样到规则的网格上才能应用.基于卷积的网格化计算具有密集型和迭代型的特点,特别是处理海量可见度数据的情况下,高性能的网格化计算对整个成像过程加速尤为重要.为了缓解数据处理的压力,在现有处理整块数据和支持多核计算的算法基础上,拓展应用Dask并行计算框架,不仅将数据分块并分配到多线程上,提高数值计算效率,而且动态的分布式任务调度策略优化了网格化的实时处理.实验结果表明,多核中央处理器利用率显著提高,即使增加数据量,也能进一步提高网格化算法的性能.分布式任务调度能够将单(多)测量集的网格化弹性缩放到单(多)机系统,充分发挥集群的规模化优势.
    • 孙宽飞; 杨文革; 滕飞; 焦义文; 高泽夫
    • 摘要: PCM/FM信号的非相干鉴频解调存在门限效应,将多符号检测技术引入PCM/FM信号的解调中,可以提高约3 dB的解调增益。多符号检测多采用FPGA实现系统功能,存在硬件设计周期较长、硬件平台通用性低和升级难度大等问题,距离软件无线电设计理念有较大的差距。针对传统硬件实现的问题,设计了基于GPU的多符号检测实现方法,根据算法原理和GPU并行方法设计出基于GPU的并行滑动相关实现方法;据此设计了基于GPU的多符号检测算法的并行化方法;设计了基于GPU的Gardner位同步算法。实验结果显示,基于GPU的多符号检测算法满足实时性的要求,解调增益稍优于FPGA系统。
    • 周志强; 崔国民; 杨岭; 马秀宝; 肖媛; 杨其国
    • 摘要: 换热网络优化是化工过程系统工程领域的研究难点,其数学模型具有高度的非凸、非线性,在使用单一启发式算法优化时,往往具有局限性。研究以换热网络的年综合费用最小为目标,针对强制进化随机游走(RWCE)算法在优化时由于个体间独立进化,导致优化过程中信息缺乏交流的问题,提出将遗传算法(GA)与其混合。混合后的算法在保持前一半优势种群中的个体单独进化的基础上,通过周期性的交叉、变异等操作产生子代来替换掉劣势种群,从而增强了原有算法的整型变量优化能力,并弥补了弱势个体无法更新的不足。为了兼顾算法在大种群下优化有分流换热网络的计算效率,节约时间成本,使用OpenMP系统将混合算法实现了并行化设计。通过三个不同规模的换热网络问题对并行后的混合算法进行验证,结果表明该算法能在有效提升优化质量的前提下相比串行算法大幅缩短计算时间,其中两个算例突破了目前文献最优解。
    • 王宇; 刘崇茹; 侯延琦; 刘昊宇; 李庚银
    • 摘要: 模块化多电平换流器(MMC)中数以千计的子模块(SM)给控制器计算带来很大负担。海量数据采集、复杂控制计算以及不同控制器间通信等因素导致整个控制链路延时较长,恶化系统动态特性,甚至导致并网后系统不稳定。设计了一种基于现场可编程门阵列(FPGA)的集成控制器,在单块FPGA板卡中实现MMC的全部控制策略。控制器充分发挥FPGA的并行特性,每种控制模块尽可能采用并行设计,并将相互独立的控制模块并行执行,以提高控制器的计算速度。基于RTDS平台进行了硬件在环实验,对所开发控制器进行功能验证。结果表明:所开发控制器链路延时短,响应速度快,可用于控制策略开发测试、控制参数调试等领域。
    • 王小庆; 胡文韬
    • 摘要: 由于高/超高增压比需要,民用航空发动机转子级数达到10级及以上,数值计算规模在百万自由度以上,需通过并行计算提高设计效率。针对民用航空发动机转子的并行数值计算方法开展研究,从区域分解模式、并行计算模式角度进行分析,结果表明:采用基于图理论的分区方式优于基于贪婪法的分区方式;相对于共享内存式并行计算模式,采用分布内存式并行计算模式可获得更短的计算耗时;针对百万自由度级民用航空发动机转子的并行计算,采用基于分布内存式并行计算模式、基于图理论的分区模式、计算核数为16核时,可以获得最佳并行计算效果。确定了针对百万自由度计算规模的民用发动机转子的最优并行计算配置,为实现民用发动机转子的快速设计提供了参考。
    • 邱鑫源; 叶泽聪; 崔翛龙; 高志强
    • 摘要: 为了解决数据共享需求与隐私保护要求之间不可调和的矛盾,联邦学习应运而生。联邦学习作为一种分布式机器学习,其中的参与方与中央服务器之间需要不断交换大量模型参数,而这造成了较大通信开销;同时,联邦学习越来越多地部署在通信带宽有限、电量有限的移动设备上,而有限的网络带宽和激增的客户端数量会使通信瓶颈加剧。针对联邦学习的通信瓶颈问题,首先分析联邦学习的基本工作流程;然后从方法论的角度出发,详细介绍基于降低模型更新频率、模型压缩、客户端选择的三类主流方法和模型划分等特殊方法,并对具体优化方案进行深入的对比分析;最后,对联邦学习通信开销技术研究的发展趋势进行了总结和展望。
    • 党皓天; 刘东; 陈飞; 赵现平; 刘斯扬; 王宏宇
    • 摘要: 随着主动配电网以及物联网技术的发展,无功设备的接入呈现复杂化和边缘化趋势,电压控制的相关计算也向边缘计算发展。由于算力受限,边缘终端纯软件式的计算所需时间较长,无法满足控制的实时性要求。针对此问题,文中提出一种基于片上系统现场可编程门阵列(SoC FPGA)硬件并行化计算的配电网电压控制策略。首先,设计基于SoC FPGA的软硬件计算框架;然后,对配电网电压控制模型及遗传算法求解方法做出适用于FPGA计算的针对性改进;最后,分模块设计FPGA硬件求解结构。算例场景验证表明,相比于边缘终端纯软件式的求解方式,文中所提策略在电压越下限、电压越上限场景的平均求解效率分别提高了2.41倍和2.15倍,可有效提升电压控制的实时性。
    • 刘颖辉; 迟学斌; 姜金荣; 张峰
    • 摘要: 基于GPU的异构计算逐渐成为主流计算方法,但限于科学计算编程的历史发展,大量的数值计算软件仍以Fortran语言实现.为了提高计算速度,大量的软件需要移植为CUDA C,但人工实现程序移植是一项浩繁的工程.若能实现从Fortran到CUDA C的自动转换,可以极大的提高程序开发效率.本文设计了将Fortran转换为CUDA C的算法,并基于正则表达式和shell脚本实现了该算法,编写测试用例进行了验证.实验表明,该算法可靠稳定兼容性好,在大型程序的移植过程中,能够自动筛选并建立变量信息表,生成CUDA相关操作函数,且结果代码可读性较好,转化正确率达80%以上,有效减少了移植的工作量.
    • 李政清; 穆继亮
    • 摘要: 在FPGA数据处理应用场合中,引入神经网络能够提高数据特征的学习能力。但是基于非嵌入式的神经网络在运算过程中通常具有显著的复杂性和稀疏性,难以直接应用于FPGA上。于是,为了提高FPGA在数据处理时的并行性和高效性,设计了基于卷积网络加速器的FPGA数据处理架构。首先对卷积网络的层进行优化设计,采用ReLU函数来加速卷积层的收敛,同时采用平均池化方案增强网络适应性,通过卷积的尺度变换对特征图采取压缩,达到在一个层中并行计算的目的。然后对FPGA的处理模块和缓存模块进行优化设计,判定器对有效数据的权值索引和计数等参数采取验证,将大量的乘加操作递交给FPGA的DSP来处理;对特征图及其中间变量采取BRAM缓存,根据横向、纵向,以及深度分别采取分配。最后,对加速器执行过程中FPGA的资源利用和执行时间进行分析,通过资源和时间因素对加速器执行过程采取调整。实验结果表明,基于卷积网络加速器的FPGA数据处理方案提高了FPGA的资源利用率和有效算力,无论是在不同平台或是不同加速器的对比情况下,都能够获得更为优秀的数据处理性能。
    • 杜翠; 王宁; 刘杰; 程远水; 张千里; 刘欢
    • 摘要: 为了提升探地雷达(Ground Penetrating Radar,GPR)数据信号处理算法的性能,建立了一种适用于单机模式的多线程并行处理方法。分析了GPR信号处理算法的并行性特征,对文件头和数据道分离存储以支撑任意道集的细粒度数据划分,采用简便的静态调度实现并行任务调度。对5种常用算法进行了串并行对比试验。结果表明:复杂度较高的算法更适宜进行并行化改造,加速比约为硬件环境物理核数,线程数可根据物理核数和CPU线程数进行优选。当数据量变化时,算法的并行加速比保持稳定,表现出良好的适应性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号