并行程序设计
并行程序设计的相关文献在1989年到2022年内共计172篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、大气科学(气象学)
等领域,其中期刊论文152篇、会议论文17篇、专利文献232356篇;相关期刊82种,包括计算机工程、计算机工程与科学、计算机教育等;
相关会议15种,包括2015全国高性能计算学术年会、中国力学学会2009学术大会、全国第19届计算机技术与应用学术会议(CACIS·2008)等;并行程序设计的相关文献由318位作者贡献,包括孙永强、刘晓平、吴巧泉等。
并行程序设计—发文量
专利文献>
论文:232356篇
占比:99.93%
总计:232525篇
并行程序设计
-研究学者
- 孙永强
- 刘晓平
- 吴巧泉
- 姚再勇
- 姚震
- 孙济洲
- 张红涛
- 张金霜
- 方滨兴
- 李智毅
- 沈志宇
- 沈美明
- 王文义
- 袁伟
- 郑启龙
- 陆林生
- 黄清南
- 万剑怡
- 于策
- 余天堂
- 倪南
- 刘瑞祥
- 姜弘道
- 孙超
- 张信一
- 张德富
- 张鹏
- 徐祯
- 戚梅
- 景晓军
- 李代平
- 李晓明
- 杨文杰
- 武华北
- 汤善江
- 沈绪榜
- 洪龙
- 温钰洪
- 石林立
- 胡晨光
- 胡铭曾
- 薛锦云
- 许胤龙
- 谢立
- 钟敏
- 钟诚
- 陈云芳
- 陈国良
- 陈崚
- 陈昌生
-
-
陈娟
-
-
摘要:
我是国防科技大学高性能计算系列课程负责人,天河拔尖班专家组成员,主讲并行计算系统、并行程序设计、高性能计算等课程,并参与了ACM/IEEE CC2020工作,特别感兴趣拔尖人才的胜任力培养方面的问题。高性能计算相关课程对学生系统能力、并行计算思维、问题求解能力都有极高要求,因此之前做了一些相关教学研究与实践探索。
-
-
-
-
摘要:
内容简介本书主要介绍计算机组成与系统结构涉及的相关概念、理论和技术,主要内容包括指令集体系结构、数据的表示和存储,以及实现指令集体系结构的计算机各部件的内部工作原理、组成结构及其相互连接。本书共分9章:第1章对计算机系统及其性能评价进行概述性介绍;第2—3章主要介绍数据的机器级表示和运算,以及运算部件的结构与设计;第4—6章介绍指令系统、各种CPU设计技术及指令流水线;第7章主要介绍包含主存、外存、cache和虚拟存储器在内的存储器层次结构;第8章介绍总线互连及输入输出系统;第9章介绍并行处理计算系统的基本硬件结构和并行程序设计编程模型。
-
-
熊智;
蔡玲如
-
-
摘要:
分析在计算机专业开展课程思政的紧迫性和并行程序设计课程的重要性,提出该课程线上线下混合的教学方式,梳理该课程的思政目标,最后论述两个教学设计案例,介绍线上方式和探究式教学法在可重入函数教学中的应用,以及线下方式和试错教学法在缓存一致性与伪共享教学中的应用.
-
-
张金霜
-
-
摘要:
针对离散小波变换过程比较耗时、不利于实际工程应用的问题,提出利用基于GPU平台的CUDA技术对小波变换算法做并行化改造,从而提高算法执行效率.该文分析了小波Mallat算法并行化的可行性,并详细介绍了算法的改造过程.实验表明,基于GPU/CUDA技术的并行小波Mallat算法,相较于串行小波变换算法,执行速度最高提升了50余倍,且算法效率与计算量成正向关系.
-
-
张金霜;
黄旭彬
-
-
摘要:
JPEG有损压缩算法以DCT变换算法为核心,但DCT变换算法较为耗时,为提升图像压缩效率,提出利用基于GPU平台的CUDA技术对DCT算法做并行优化.通过分析DCT变换算法的原理,发现DCT算法具有很好的并行性,优化空间较大,于是利用CUDA技术实现高速DCT并行算法.实验结果表明,在一张2592×2592分辨率的图像做DCT变换,加速比能达到124.5,算法效率得到明显提升,且压缩效果无显著差异.
-
-
张金霜
-
-
摘要:
针对离散小波变换过程比较耗时、不利于实际工程应用的问题,提出利用基于GPU平台的CUDA技术对小波变换算法做并行化改造,从而提高算法执行效率。该文分析了小波Mallat算法并行化的可行性,并详细介绍了算法的改造过程。实验表明,基于GPU/CUDA技术的并行小波Mallat算法,相较于串行小波变换算法,执行速度最高提升了50余倍,且算法效率与计算量成正向关系。
-
-
-
程李东;
姜毅;
牛钰森
-
-
摘要:
为提高单炮多发同时弹着的弹道计算精度,基于标准条件下二维质点弹道方程和真空二维弹道斜射程公式,提出了一种局部插值算法.通过缩小插值区间加密插值序列提高弹道计算精度,研究了该局部插值算法的MPI并行实现方法,该方法可有效减少弹道计算消耗的时间,保证计算耗时满足战场要求.给出了并行计算的任务分配方案和并行效率的计算.并行效率与计算核心数量的关系表明弹道计算机的 CPU 核心数存在一个上限.以5~15 km射程的同时弹着弹道计算为例,验证了该文算法的有效性和高效性.%In order to improve the computation accuracy of the ballistics for multiple-round simultaneous-impact( MRSI) of single artillery, the local interpolation algorithm ( LIA) was proposed based on 2D particle trajectory equation under standard conditions and vacuum 2D trajectory oblique-range formula. It can obviously improve the accuracy to reduce the interpolation interval and increase interpolation sequence. The MPI based parallel computation technique was used in the local interpolation algorithm. The method can effectively reduce the computation time and ensure the computation time satisfy battlefield requirements. The task allocation scheme in the parallel computation was given,and the parellel efficiency was computed. Relationship between this parallel computation efficiency and the number of CPU cores used shows that there is an upper limit on number of CPU cores of ballistic computer. The MRSI computa-tion task was carried out with range between 5 km to 15 km to verify the validity and efficiency of the algorithm.
-
-
徐唐剑
-
-
摘要:
A*算法是一种在求解最短路径时最常用也是最有效的直接搜索方法,也是在图论、人工智能、智能控制等领域最常用的启发式搜索算法.路径问题在日常工作、生活中是一个非常常见的问题,对搜索算法进行优化是解决路径问题的非常重要的一步.在简单介绍Dijkstra算法和传统的A*算法并使用Python编程实现的基础上,针对常规A*算法时间性能较差的问题,利用Python编程实现双向A*寻路算法,针对A*算法的改进进行探讨.
-
-
王一拙;
陈旭;
计卫星;
苏岩;
王小军;
石峰
-
-
摘要:
任务并行程序设计模型已成为并行程序设计的主流,其通过发掘任务并行性来提高并行计算机的系统性能.提出一种支持容错的任务并行程序设计模型,将容错技术融入到任务并行程序设计模型中,在保证性能的同时提高系统可靠性.该模型以任务为调度、执行、错误检测与恢复的基本单位,在应用级实现容错支持.采用一种Buffer-Commit计算模型支持瞬时错误的检测与恢复;采用应用级无盘检查点实现节点故障类型永久错误的恢复;采用一种支持容错的工作窃取任务调度策略获得动态负载均衡.实验结果表明,该模型以较低的性能开销提供了对硬件错误的容错支持.
-
-
张文勇
- 《2007年全国高性能计算学术年会》
| 2007年
-
摘要:
OpenMP有循环级和SPMD(单程序多数据)两种编程方式。本文详细介绍了三维分子动力学模拟程序MDP的两种OpenMP并行程序设计方法。循环级方式的OpenMP程序编程简单但可扩展性很差;SPMD方式的OpenMP程序可以将数据局部化,实现粗粒度的并行,获得良好的可扩展性.测试结果表明,循环级方式的OpenMP程序只在处理器数据局少时有较好的加速比,而SPMD方式的OpenMP程序具有跟MPI相当的并行性能,可以近似线性地扩展到4096个处理器。
-
-
Wu Linping;
武林平;
Xu Xiaowen;
徐小文;
Wei Yong;
魏勇;
Liu Xu
- 《2015全国高性能计算学术年会》
| 2015年
-
摘要:
受到部件亚健康、共享资源的竞争使用、操作系统干扰等因素的影响,运行中的高性能计算机各部件的实际输出性能存在波动现象.随系统规模、数值模拟程序并行度的增大,局部部件性能不稳定性的影响会被放大,从而严重制约数值模拟程序的性能及可扩展性、降低系统运行效率.在此背景下,高性能计算机的性能不稳定现象成为高性能计算机系统、数值模拟应用双方共同关注的问题,针对该问题的深入研究对于未来E级海量并行场景的系统软硬件设计、大规模数值模拟应用程序的设计均具有参考意义.本文从性能不稳定性的量化、原因定位、影响评估及消除策略四个方面剖析相关研究的现状和发展动态:1)从计算、访存、通信三方面介绍高性能计算机性能不稳定度的量化方法;2)分析各类性能不稳定因素的原因及其定位方法;3)针对各类性能不稳定性原因,从理论分析、实际测量、仿真分析三个方面梳理系统性能不稳定性对数值模拟应用的影响评估机制;4)从系统管理机制、系统软件研制、并行程序设计等方面总结降低性能不稳定影响的各类手段.最后,分析研究现状与实际需求的差距,并展望未来的研究思路.
-
-
-
-
-
王恩柱;
刘晓平
- 《全国第17届计算机科学与技术应用(CACIS)学术会议》
| 2006年
-
摘要:
从方便用户进行并行程序设计的角度出发,开发了一个基于图形的可视化并行程序开发平台.该平台主要由三层构成,在应用层用户通过图形的方式确定各进程间的通信关系;在进程层使用平台提供的图标完成相应的程序设计;最后,在代码层通过代码产生器生成并行程序.图形方式隐藏了并行机制,降低了并行程序设计的难度。
-
-
-
-