高性能计算
高性能计算的相关文献在1993年到2022年内共计1517篇,主要集中在自动化技术、计算机技术、工业经济、无线电电子学、电信技术
等领域,其中期刊论文1094篇、会议论文196篇、专利文献546327篇;相关期刊433种,包括计算机工程、计算机工程与科学、计算机工程与设计等;
相关会议86种,包括2012全国高性能计算学术年会、2011年全国高性能计算学术年会(HPC china2011)、2009年全国高性能计算学术年会等;高性能计算的相关文献由2834位作者贡献,包括B·D·约翰森、L·霍雷恩、迟学斌等。
高性能计算—发文量
专利文献>
论文:546327篇
占比:99.76%
总计:547617篇
高性能计算
-研究学者
- B·D·约翰森
- L·霍雷恩
- 迟学斌
- 肖海力
- B·博格丹斯基
- 卢凯
- 王小宁
- 钱德沛
- 刘阳
- 卢宇彤
- 曹荣强
- 林新华
- 盛乐标
- 陆忠华
- 刘光明
- 刘羽
- 卢莎莎
- 王涛
- 谢向辉
- 金先龙
- 金莲
- 陈国良
- D·G·莫克斯纳斯
- 丁峻宏
- 何晓斌
- 姜金荣
- 孙凝晖
- 张云泉
- 李根国
- 游伟倩
- 董勇
- 蒋金虎
- 侯正雄
- 刘杰
- 刘轶
- 周恩强
- 张予倩
- 张伟
- 王一超
- 王云岚
- 王玲
- 程耀东
- 许振新
- 赵东升
- A·斯瑞尼瓦桑
- 吕文静
- 吴伟
- 张鉴
- 朱建涛
- 杜云飞
-
-
无
-
-
摘要:
cqvip:i项目概况基于大容量指纹识别的实时身份认证系统是由中国科学院超级计算中心与北京刑事科学技术研究所共同开发的基于高性能计算的全国人员身份实时认证计算服务系统,可实时确认可疑人员的身份信息。Q应用范围作为物证之首,指纹特征的唯一性和不变性已经得到公认和历史的检验。我国人口基数大,流动人员多,并处于社会重大快速转型时期,跨区域犯罪、流窜犯罪、系列案件有所上升。
-
-
李浩东;
胡洁;
范勤勤
-
-
摘要:
基于分区搜索的多模态多目标优化属于一种决策空间分解策略,因此它具有天然的并行性。为提高求解效率,提出了一种并行分区搜索(Parallel Zoning Search,PZS)方法来辅助多模态多目标进化算法。在PZS中,首先将多模态多目标优化问题的整个决策空间划分为多个子空间,然后利用并行计算技术来实现选定的多模态多目标进化算法在各个子区域内进行并行搜索,最后将所有子空间得到的解集进行合并和选择。为验证所提方法的有效性,文中设计了两组实验:1)在所有对比算法的运行时间相同的条件下进行实验;2)在所有对比算法的函数评价次数相同的条件下进行实验。结果表明,在计算时间相同的情况下,所提方法能够有效提高选定的多模态多目标进化算法在决策空间中所得解集的质量;而在相同函数评价次数条件下,其能够节省计算时间。文中还将与PZS相结合的多模态多目标进化算法用于求解考虑碳排放的海铁联运能耗多模态多目标优化问题,所得结果可以为海铁联运中的环境保护和运输时间问题提供决策支持。
-
-
苟悦宬
-
-
摘要:
为了提升矩阵乘法的运算速度,优化运算性能,提出了一种基于并行计算的方法。采用OpenMP+MPI混合编程,选用华为鲲鹏处理器和PC机作为实验平台。其中MPI将分块后的小矩阵广播至每个进程,在每个进程中使用OpenMP进行矩阵相乘的运算,再使用MPI进行运算结果的聚集,最后显示时间性能等相关信息。分别选用PC机,单台和多台华为鲲鹏服务器,分配不同的进程数,对运算结果进行了相关性能的分析与总结。
-
-
张远;
张大伟;
陈仁;
华建文
-
-
摘要:
随着遥感卫星更高时空分辨率的大气探测需求,大气遥感高光谱数据量骤增,传统高光谱数据的处理效率较低,无法满足高性能处理高光谱数据的需求.首先介绍了国内外研究者利用图形处理器(GPU)加速处理遥感高光谱数据的应用实例,然后对基于CPU-GPU异构模式的大气遥感高光谱数据傅里叶分析的并行化计算进行了研究,并进行算法实现,最后同传统基于CPU计算做了实验比较.实验结果表明,使用基于CPU-GPU异构模式的方法处理高光谱数据时,在保证数据准确性的同时速度提升80多倍,验证了将GPU加速用于处理大气遥感高光谱数据的有效性,可以更好地满足气象卫星更高时空分辨率的大气探测需求.
-
-
-
-
-
石京燕;
黄秋兰;
汪璐;
李海波;
杜然;
姜晓巍;
胡庆宝;
郑伟;
闫晓飞;
张玄同
-
-
摘要:
【目的】本文对国家高能物理科学数据中心分布式数据平台进行系统全面介绍,为高能物理及相关领域大科学实验的数据处理提供参考。【方法】文章介绍了国家高能物理科学数据中心分布式数据处理平台的总体构成、运行模式和智能运维等方面的关键技术。通过分析高能物理实验数据处理的计算特点与实际需求,介绍了数据中心“一平台多中心”的数据处理平台建设思想,阐述了平台为高能物理实验提供的跨地域资源共享、高性能海量数据访问以及用户实时交互服务等技术方案设计与实现。【结果】文章列举了数据中心分布式数据处理平台对两个高能物理实验的支持实例,助力科学研究成果获取。【结论】国家高能物理科学数据中心分布式数据处理平台已经成为高能物理学科的重要基础设施和组成,是学科融合、开展新研究方法的主要场所,满足了粒子物理、理论物理、空间天文、射线学科、加速器设计等科研领域的数据处理需求。
-
-
林新华;
王杰;
王一超;
左思成
-
-
摘要:
同时可记录的处理器硬件事件数量受限于处理器硬件性能计算器的数量.目前主流处理器可支持大量(数百个)硬件事件,但由于片上寄存器数量有限,仅提供了少量(通常6~12个)硬件性能计数器.为缓解这一矛盾,硬件计数器复用技术(multiplexing,MPX)通过分时复用策略,利用少量计算寄存器来估算大量硬件事件.但在实践中,由于已有基于时间局部性的MPX估计算法结果准确率偏低,导致MPX一直未被广泛采用.为了提升MPX结果准确率,主要工作包括3部分:1)通过Kolmogorov-Smirnov正态性检验,发现针对同一硬件事件,相同代码在单计数器记录单事件(one counter one event,OCOE)的OCOE模式和MPX模式下,存在数据分布一致性的规律;2)基于此规律,提出了轮廓线估计法(outline estimation,OLE);3)在开源MPX库NeoMPX上实现了OLE算法,并在主流X86和ARM处理器上进行了验证.实验结果表明:在对16个硬件事件同时进行采集时,OLE算法相比PAPI默认的MPX估计算法,结果准确率平均提高了10.5%左右,最多可提升46.6%;相比已有算法,结果准确率分别提升了18.8%和17.7%.
-
-
-
Zhao Shicao;
赵士操;
Xiao Yonghao;
肖永浩;
Duan Bowen;
段博文;
Li Yufeng;
李于锋
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
在科学研究和工程实际中,集成系列软件形成"建模、计算、分析、优化"一体化应用已经成为目前的数值模拟应用趋势.对于高性能计算资源的运营方而言,为了适应这个趋势需要解决数值模拟工作流建模与高效执行、异构计算资源屏蔽等关键技术问题并提供适用于高性能计算服务的应用接口.HSWAP平台是适用于高性能计算环境的数值模拟工作流管理平台,实现了1)封装数值模拟软件形成适用于Web Portal的服务,并支持交互界面推送;2)支持流程化集成数值模拟软件服务,形成的数值模拟工作流可自动高效执行;3)屏蔽异构计算资源细节,数值模拟工作流可迁移共享;4)支持数值模拟工作流的交互式设计,目前已在中国工程物理研究院得到部署应用.
-
-
JIA Xun;
贾迅;
Qian Lei;
钱磊;
Wu Guiming;
邬贵明;
Wu Dong;
吴东;
Xie Xianghui;
谢向辉
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
提升计算能效并满足新兴应用的性能需求是目前超级计算系统面临的两大挑战.FPGA低功耗和可重构的特性为应对上述挑战提供了可能.现有研究通过分析FPGA上计算核心的实际性能,探索了FPGA应用于高性能计算的可行性.但其性能分析未考虑卷积神经网络计算核心且缺乏高性能处理器作为参照.本文针对当前高性能计算领域主要的计算核心,包括广度优先搜索、稀疏矩阵向量乘、Stencil、Smith-Waterman和卷积神经网络,总结了FPGA上各计算核心的实现和性能优化,并将其与SW26010众核处理器进行了对比.同时,本文还探讨了FPGA应用于高性能计算存在的若干问题.本文的分析表明,当前FPGA的能效最高为SW26010的63倍;FPGA上新兴应用如图计算和深度学习的性能最高为SW26010的26倍.未来,降低FPGA的通信开销,提升其可编程性并完善基于FPGA的科学计算软件库可有效推动FPGA应用于高性能计算.
-
-
Zhu Guanghui;
朱光慧;
Zeng Yunhui;
曾云辉
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着E级计算机的研制建设,高性能计算系统结构日益复杂.由于参与大规模并行计算的节点数巨大,并行作业运行过程中发生故障的概率也随之增加.各种软件硬件资源故障都可能导致应用程序异常中断.利用已有的作业管理系统和工具,在一定程度上可以获取作业运行状态、计算资源状态及其故障信息.但是,由于获取的故障信息较多且关联性强,很难快速定位故障根源;另一方面,故障处理策略不合理,导致故障响应时间过长、无法快速恢复.本文提出了一种大规模并行作业运行故障快速定位方法,首先,介绍了基于状态获取的故障信息,然后列出了可能导致作业运行失败的原因事件,并对其进行分类和严重等级分级.进而,通过问题规模及其关联关系建立了一种针对批量的大规模作业的故障分析方法.本方法由上而下、逐层排查故障原因,缩小了故障的处理范围,结合自动化判断分析,有效解决了大规模作业运行过程中故障定位难且准确性差的问题.最后,通过实例验证了该方法的有效性,为运行管理人员排查故障提供帮助.
-
-
Guo Yayu;
郭亚宇;
Lin Fang;
林放;
Liu Yi;
刘轶;
Qian Depei;
钱德沛
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着多核/众核处理器和异构加速部件的快速发展,高性能计算机系统规模不断增大.超大规模的并行系统需要与之相适应的可超大规模并行执行的应用程序.这给并行程序的编程、调试和调优带来了多方面的挑战.本文设计实现了一种可以支持程序大规模并行运行的MPI仿真环境.并行应用程序仅需在高性能计算机上以期望的规模(进程数)执行一次,其后,利用真实运行过程中记录的进程间通信信息,仿真环境可在2个节点上以相同规模多次重复执行并行应用程序中的1个或多个进程.用户在程序执行过程中可以配合调试工具对进程进行交互控制,为大规模并行程序的测试、调试、性能调优提供帮助.
-
-
Liu Yusheng;
刘宇胜;
Liu Guangming;
刘光明;
Yu Jie;
喻杰
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着高性能计算机计算能力的不断发展,高性能计算应用的I/O需求快速增长,需要高性能计算机存储子系统实现高带宽、低延迟的目标,存储系统正面临严峻的I/O压力.基于FUSE开发的分布式文件系统客户端中,VFS页缓存和FUSE内核成为制约系统性能的重要瓶颈.缓存技术是减轻高性能计算机系统I/O瓶颈的经典技术,本文针对典型高性能应用I/O特性,结合高性能计算机支持RDMA通信的优势,提出一种与RDMA缓存统一管理的客户端缓存机制对masFS客户端进行改进.最后将改进前后的文件系统客户端在TH-1A系统上进行部署测试,测试结果表明,客户端缓存可以显著提升应用程序客户端I/O性能,客户端顺序读、写带宽最大可达到基于页缓存的原系统的4.8、2.3倍.
-
-
Yan Hui;
颜辉;
Zhu Bojing;
朱伯靖;
Wan Wen;
万文;
Zhong Yin;
钟英
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
大时空尺度湍流磁重联(LTSTMR)是空间物理、太阳物理、宇宙学领域中的一种普遍存在的爆发现象.磁能转移-释放-耗散、等离子体加热及高能粒子加速是研究该类现象的核心内容,而湍流在LTSTMR中如何起作用是解决以上问题的关键所在.二维磁重联模型因其在物理图像简化方面忽略了自然界爆发现象的三维属性和本质,物理图像基础存在不足,这种不足随着不断更新的观测技术所提供的观测结果的数据累积,在探索LTSTMR物理问题方面的缺陷日益明显和突出.三维磁重联模型方面,上世纪八十年代至本世纪初,因数值算法和高性能计算资源方面的限制,很长一段时间内制约了其在数值模拟及探索物理图像方面的应用.本世纪最近十年以来,随着超级计算平台的高速发展,为基于三维模型的数值工作提供了平台和条件.本研究基于新型HPIC-LBM粒子算法,在"天河二号"平台上开展LTSTMR的数值实验工作.首次获得了太阳大气活动磁重联精细演化(~500km)耗散区内oblique不稳定性证据.证明了高能带电粒子可以在相对较长时标内(~38s)被加速,为解释太阳风中高能粒子可被加速到较高能位提供了更符合观测结果的证据.该研究为在超算平台上应用三维磁重联模型开展大时空尺度湍流磁重联提供了一种新途径和手段.
-
-
Xiao Yonghao;
肖永浩;
Xu Lunfan;
许伦凡;
Xiong Min;
熊敏
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
在高性能计算作业调度中,许多调度算法依赖于对作业运行时间的准确估计,尤其是以EASY为代表的回填算法,而使用用户提供的作业运行时间往往会降低调度性能.本文提出了一种基于分类和实例学习相结合的作业运行时间预测算法-GA-Sim,该算法在考虑预测准确性的同时考虑了低估问题.在两个实际调度日志上的数值实验结果表明,相较于IRPA和TRlP算法,GA-Sim在取得更高预测精度的同时降低了低估率.丈章对数值实验结果进行了深入的分析,并给出了不同情形下选择恰当预测算法的建议.
-
-
Yu Yang;
余洋;
Qin Wei;
覃伟;
Tian Yongjun;
田永军;
He Wanqing;
何万青
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
随着云计算的迅猛发展,虚拟化技术日趋成熟,通信延迟逐渐降低,高性能计算(High Performance Computing,HPC)应用在云上的部署成为可能.高性能计算常用于处理大规模、紧耦合的计算任务,因此对硬件计算能力和数据传输效率有着很高的要求.为了评估HPC应用在云计算平台上部署的可行性,本文以亚马逊云计算服务(Amazon Web Services,AWS)为基准测试对象,选取主流HPC Benchmark和科学计算应用对AWS EC2服务的三款高端实例进行多方位测试,获取其在浮点运算、网络通信和I/O读写方面的峰值数据以及在实际HPC应用场景下的性能表现,并对比了阿里云弹性裸金属服务器超级计算集群SCC上的性能表现.此外,本文还根据实验结果对云上HPC集群资源配比和使用方式进行分析,探寻高性价比的云上HPC集群构建和使用方案,为HPC应用上云提供参考.
-
-