GPU加速
GPU加速的相关文献在2008年到2023年内共计424篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、原子能技术
等领域,其中期刊论文133篇、会议论文10篇、专利文献36448篇;相关期刊80种,包括地球物理学报、中国医学物理学杂志、中国图象图形学报等;
相关会议8种,包括2010年中国计算力学大会暨第八届南方计算力学学术会议、第八届中国计算机图形学大会、第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第5届全国普适计算学术会议(PCC2010)、第6届全国人机交互学术会议(CHCI2010)等;GPU加速的相关文献由1148位作者贡献,包括周赣、冯燕钧、孙立成等。
GPU加速—发文量
专利文献>
论文:36448篇
占比:99.61%
总计:36591篇
GPU加速
-研究学者
- 周赣
- 冯燕钧
- 孙立成
- 张旭
- 柏瑞
- 秦成明
- 傅萌
- 尤萨梅·杰伊兰
- 维尼特·戈尔
- 卢海山
- 姚瑶
- 贾世宇
- 龚曙光
- 何朝伟
- 刘羽
- 张亮
- 张建平
- 李琦
- 潘振宽
- M·L·施密特
- R·梅亚坎罗特尔
- 于戈
- 何桃
- 何炯
- 卢伟超
- 宋利
- 徐明
- 李廷
- 林名培
- 沈晓峰
- 温雯
- 王振宇
- 王浩
- 王章野
- 王荣刚
- 董胜富
- 蔡瑞初
- 袁志勇
- 赵坤垚
- 赵智宝
- 赵汉理
- 赵章宗
- 郝志峰
- 陈炳丰
- 陈瑶
- 马文萍
- 马晶晶
- 高文
- 龙鹏程
- 侯精明
-
-
邹航;
梁亮;
张乾;
宋佩涛;
赵强
-
-
摘要:
目前特征线方法(MOC)被广泛应用于反应堆精细中子输运计算。为提高基于MOC方法的时空中子动力学输运计算效率,本文开发了ALPHA程序的动力学计算模块,实现了基于GPU并行的二维精细动力学输运计算。同时,实现了基于GPU并行的CMFD加速计算,并对TWIGL基准题和MINI-CORE基准题进行验证。数值结果显示,基于GPU并行的中子动力学计算方法能保证良好的计算精度,且具有明显的加速效果。
-
-
成博韬;
曾丽娜;
李林
-
-
摘要:
随着开发项目体量的扩大,软件开发类项目组的成员容量逐渐增大,数据传输与文件交换较为频繁。由于项目开发需要一定的安全性,在很多的项目中,一般不会选择一些公开的即时通讯软件。与此同时,在文件传输过程中,还需要追求传输的速度和容量,因此一些网盘类软件也不能很好地满足需求。在一些大数据分析的项目中,还需要参考计算机的硬件配置进行合理化分配。针对以上问题,本方案提出了一套任务分解推送措施,通过账号信息加密功能实现个人及项目安全保护,使用户可以自定义传输目标,根据个人需求选择传输空间。针对不同时效性的文件,系统设置了短期文件处理回收站,定期清理即时文件,减少服务器的负担。分析不同配置计算机的性能情况,给出任务分发的最优解。
-
-
祝衔琦;
孙祥程;
王娴
-
-
摘要:
为了设计更高效、高机动性的扑翼飞行器,需要对扑翼运动机理进行细致的动力学研究。其中,迎角是影响扑翼运动气动性能的关键因素。本文结合格子Boltzmann法与Level-Set动边界识别法,建立了含有动边界的流场模拟方法,并采用GPU加速,数值研究了迎角对扑翼运动气动性能的影响。结果表明:增大迎角,扑翼运动的升阻比呈现先增大后减小的趋势,当迎角θ=10°时,能够获得最佳气动性能。θ=0°~40°范围内,随着迎角的增大,扑翼翼尖处的上下翼面压差比翼根、翼中处大,在翼尖处提供了更大的升力。随着迎角的增大,扑翼的前缘涡附着于翼面的面积明显增大,扑翼后方脱落的涡旋也较难耗散,提高了扑翼的升力;同时,翼尖涡的强度和影响范围变大,增加了扑翼的阻力。
-
-
武祯;
路伟;
鄢书畅;
邱睿;
张辉;
李君利
-
-
摘要:
针对辐射剂量学领域人员剂量快速评估的应用需求以及现有通用蒙卡程序计算时间过长的问题,本文开发了基于GPU加速的光电耦合输运蒙卡程序Gadep。根据GPU显卡CUDA编程模型下内存、线程层次结构和执行模型中的硬件层次结构特点,对程序框架、粒子输运、步长抽样、数据结构和截面访问等进行了设计和优化。通过计算ICRP 116号成年男性参考人体素模型器官外照射剂量转换系数,对程序进行了正确性验证,和通用蒙卡程序MCNP5单核计算相比,加速效率在48~300倍。以南京放射源丢失事故人员物理剂量重建为例对该程序进行了实际应用,物理剂量重建计算结果和参考值、临床诊断结果相一致,与通用蒙卡程序MCNP5单核计算相比加速效率达到50倍以上,表明Gadep在事故剂量重建、放射诊断及治疗剂量评估等方面有一定的应用价值。
-
-
李晓东;
胡一鸣;
池亚平;
钱榕;
张健毅
-
-
摘要:
随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为通用的、普及化的算力资源.本文基于通用的计算机平台,提出了利用其本地GPU进行CTR工作模式下SM4算法高速加解密的并行实现和优化方案.实验表明,本文提出的SM4-CTR并行加解密方案能够有效提高SM4算法的运行效率,在通用的计算机平台上,能够达到40倍加速比,加解密速率达到了14.192 Gbps.实验中还分析了线程块划分对GPU并行加速效果的影响,最优线程块大小为128到512,且必须为32的整倍数.最后,基于本文实验的结果与其他团队的优化SM4方案进行对比,包括传统工作模式下利用CPU、GPU优化的方案和利用软件快速实现的方案,对比结果显示即便之前团队的方案运行的平台硬件条件好于本文实验环境,文中提出的方案运行速率依然能做到大幅领先.因此,本文方案在安全性、运算速率提高的同时适用平台也更加广泛,在实际生活中针对大数据和个人数据的安全保护中必将发挥巨大的作用.
-
-
李展辉;
曹学峰;
朱自强
-
-
摘要:
随着探地雷达问题复杂度的加大以及对解释精度要求的提高,探地雷达三维正演模拟越来越重要,对高性能计算的需求也越来越大.常规三维正演模拟主要采用时域有限差分法开展,并且随着计算机技术的发展,GPU加速已经成为一种三维正演主流加速方法.但是GPU本身的显存相比CPU能利用的内存而言非常有限,要充分利用其加速性能,就需要尽量压缩存储的需求.相比有限差分,伪谱法是一种在空间上具有非常高精度的波动方程正演方法,理论上每个波长只需2个空间采样点便能达到较好的精度,能够利用其空间高精度特征,采用大尺寸网格压缩内存需求.因此,将基于GPU加速的伪谱法应用到探地雷达三维正演中,压缩探地雷达三维正演对显存的需求,充分利用GPU的高性能浮点计算能力进行加速.研究表明,相比有限差分法,伪谱法至少能压缩8倍以上的内存需求量,使得原本因显存需求过大无法使用GPU加速的问题能够充分利用GPU加速性能,大幅提高计算效率,并推进三维逆时偏移成像与全波形反演的发展.
-
-
王宇奇;
勾文进;
陈明慧;
张帅;
郑耀
-
-
摘要:
采用移动粒子半隐式(MPS)法和GPU并行加速技术,对双股射流撞击式雾化过程进行了数值模拟,分析了射流孔径比和动量比的变化对雾化特性参数的影响.模拟成功捕捉到了典型工况下一次雾化液膜破碎成液丝、液丝进一步破碎成液滴的全过程.获得了喷雾扩散角、液膜破碎长度、雾化液滴索特尔平均直径和雾场偏斜角等雾化特性参数.数值结果表明,孔径比的变化会引起雾场一定程度的偏斜,形成凹形液膜;动量比主要影响雾场的偏斜程度,动量比从1.0变化到2.0时,雾场偏斜角从0°增加到21°;孔径比和动量比的增大会引起喷雾扩散角的增大,但变化幅度较小;孔径比和动量比的增大都会使得液膜破碎长度和雾化液滴的索特尔平均直径增大.
-
-
李美锟;
杨明夏;
凌滨
-
-
摘要:
垃圾分类成为日常所需,为解决垃圾分类的问题,使投放垃圾变得更加环保高效,本文设计了基于GPU深度学习的智能垃圾桶.应用Tensorflow深度学习框架,使用GPU加速训练,并结合硬件树莓派处理垃圾的图像信息,通过单片机控制步进电机实现垃圾分类.本设计具有分类准确度高,使用简单便捷,可实现垃圾分类的清洁化、高效化、智能化.
-
-
桂志强;
姚裕友;
张高峰;
徐本柱;
郑利平
-
-
摘要:
3D-power图在图形学和流体仿真等领域应用广泛.为解决已有的3D-power图计算方法时间性能较差的问题,提出了基于GPU的power图构造算法,给出了一种用于计算power图各区域之间的面积估值方法,使基于GPU的构造算法与Lloyd算法、牛顿法相结合,生成满足约束条件的3D质心容量限制power图(3D-centroidal capacity constrained power diagram,3D-CCCPD).结果表明,本文算法的时间性能较已有的3D-power图构造方法提高了几个数量级.
-
-
薛保珊;
张峰峰;
闫晓剑;
陈军
-
-
摘要:
椎弓根钉置钉虚拟手术仿真训练系统均有着计算复杂度高、视觉和触觉刷新率低、操作性差的问题进而导致手术训练效果差.针对该问题搭建了一套基于Graphic Processing Unit(GPU)加速的椎弓根钉置入虚拟手术仿真系统.首先通过使用混合数据模型实现对脊柱的三维重建;其次利用碰撞检测、力反馈计算和体素消除等技术完成手术虚拟仿真系统的搭建;最后将GPU的并行处理框架应用于系统仿真模拟中,提高系统的实时性.对比实验结果表明:在未经GPU加速虚拟仿真系统中,视觉刷新率为10 Hz左右,触觉刷新率为50 Hz左右,采用GPU加速技术,视觉刷新率基本稳定在80 Hz左右,提升了70%,触觉刷新率达到600 Hz左右,性能得到极大的提升,即使用GPU加速的虚拟手术系统能够大大缩短触觉线程与视觉线程的计算时间,提高刷新率,进而提高系统的可操作性.
-
-
-
-
-
-
-
刘小虎;
胡耀国;
符伟
- 《2010年中国计算力学大会暨第八届南方计算力学学术会议》
| 2010年
-
摘要:
随着科学和工程问题规模的增大和建模水平的不断提高,有限元分析对计算能力的需求不断上升.目前大规模计算普遍采用CPU服务器集群并行模式,节点上CPU的低效率和高能耗成为系统性能提升的主要障碍,而且,CPU核心架构的效率及其核心数量都难以获得较大突破.自从2007年nVidia正式发布用于通用计算领域的CUDA开发平台以来,GPU计算技术发展迅猛,已经成为了高性价比的并行计算平台,广泛用于诸多科学计算领域,例如,生物和生命科学领域的DNA-RNA 序列对比、3D 蛋白质对接仿真,计算电磁学领域的离子束动力学和量子电磁动力学模拟,大气与空间科学领域的海啸模拟、天气预测仿真,计算流体力学领域的3D 超音速气流模拟计算,金融领域的债券定价和风险计算分析,化学领域的量子化学计算,分子动力学领域的多个分子动力学GPU 计算软件包,被认为是未来的主流计算平台之一.
-
-
刘小虎;
胡耀国;
符伟
- 《2010年中国计算力学大会暨第八届南方计算力学学术会议》
| 2010年
-
摘要:
随着科学和工程问题规模的增大和建模水平的不断提高,有限元分析对计算能力的需求不断上升.目前大规模计算普遍采用CPU服务器集群并行模式,节点上CPU的低效率和高能耗成为系统性能提升的主要障碍,而且,CPU核心架构的效率及其核心数量都难以获得较大突破.自从2007年nVidia正式发布用于通用计算领域的CUDA开发平台以来,GPU计算技术发展迅猛,已经成为了高性价比的并行计算平台,广泛用于诸多科学计算领域,例如,生物和生命科学领域的DNA-RNA 序列对比、3D 蛋白质对接仿真,计算电磁学领域的离子束动力学和量子电磁动力学模拟,大气与空间科学领域的海啸模拟、天气预测仿真,计算流体力学领域的3D 超音速气流模拟计算,金融领域的债券定价和风险计算分析,化学领域的量子化学计算,分子动力学领域的多个分子动力学GPU 计算软件包,被认为是未来的主流计算平台之一.
-
-
刘小虎;
胡耀国;
符伟
- 《2010年中国计算力学大会暨第八届南方计算力学学术会议》
| 2010年
-
摘要:
随着科学和工程问题规模的增大和建模水平的不断提高,有限元分析对计算能力的需求不断上升.目前大规模计算普遍采用CPU服务器集群并行模式,节点上CPU的低效率和高能耗成为系统性能提升的主要障碍,而且,CPU核心架构的效率及其核心数量都难以获得较大突破.自从2007年nVidia正式发布用于通用计算领域的CUDA开发平台以来,GPU计算技术发展迅猛,已经成为了高性价比的并行计算平台,广泛用于诸多科学计算领域,例如,生物和生命科学领域的DNA-RNA 序列对比、3D 蛋白质对接仿真,计算电磁学领域的离子束动力学和量子电磁动力学模拟,大气与空间科学领域的海啸模拟、天气预测仿真,计算流体力学领域的3D 超音速气流模拟计算,金融领域的债券定价和风险计算分析,化学领域的量子化学计算,分子动力学领域的多个分子动力学GPU 计算软件包,被认为是未来的主流计算平台之一.
-
-
刘小虎;
胡耀国;
符伟
- 《2010年中国计算力学大会暨第八届南方计算力学学术会议》
| 2010年
-
摘要:
随着科学和工程问题规模的增大和建模水平的不断提高,有限元分析对计算能力的需求不断上升.目前大规模计算普遍采用CPU服务器集群并行模式,节点上CPU的低效率和高能耗成为系统性能提升的主要障碍,而且,CPU核心架构的效率及其核心数量都难以获得较大突破.自从2007年nVidia正式发布用于通用计算领域的CUDA开发平台以来,GPU计算技术发展迅猛,已经成为了高性价比的并行计算平台,广泛用于诸多科学计算领域,例如,生物和生命科学领域的DNA-RNA 序列对比、3D 蛋白质对接仿真,计算电磁学领域的离子束动力学和量子电磁动力学模拟,大气与空间科学领域的海啸模拟、天气预测仿真,计算流体力学领域的3D 超音速气流模拟计算,金融领域的债券定价和风险计算分析,化学领域的量子化学计算,分子动力学领域的多个分子动力学GPU 计算软件包,被认为是未来的主流计算平台之一.
-