公开/公告号CN102799708A
专利类型发明专利
公开/公告日2012-11-28
原文格式PDF
申请/专利权人 苏州超集信息科技有限公司;
申请/专利号CN201210200692.5
发明设计人 姚业磊;
申请日2012-06-18
分类号G06F17/50;H04L29/08;
代理机构南京苏科专利代理有限责任公司;
代理人王玉国
地址 215123 江苏省苏州市工业园区金鸡湖大道国际科技园
入库时间 2023-12-18 07:26:32
法律状态公告日
法律状态信息
法律状态
2015-02-11
授权
授权
2013-01-23
实质审查的生效 IPC(主分类):G06F17/50 申请日:20120618
实质审查的生效
2012-11-28
公开
公开
技术领域
本发明涉及一种应用于电磁仿真的GPU高性能计算平台装置。
背景技术
针对计算资源数量大、种类多、用户更是来自多个部门和项目的复杂环境,系统不可能简单通过系统管理员人工地实现有效管理和维护,建设一个统一的开放式IT综合应用服务平台是必需的。
在现有的电磁仿真中CST STUDIO SUITE是面向3D电磁、电路、温度和结构应力设计的一款仿真软件,提供完整的系统级和部件级的数值仿真分析,典型应用包含各类天线RCS、EMI/EMS、SI/PI、带电粒子与电磁场相互作用、场路、电磁温度及温度形变等各类协同仿真;
COMSOL Multiphysics是一款多物理场耦合分析软件,广泛应用于各个领域的科学研究以及工程计算,模拟科学和工程领域的各种物理过程。
发明内容
本发明的目的是克服现有技术存在的不足,提供一种应用于电磁仿真的GPU高性能计算平台装置。
本发明的目的通过以下技术方案来实现:
应用于电磁仿真的GPU高性能计算平台装置,其特征在于:包括GPU计算机服务器和并行存储系统,所述GPU计算机节点由58个1U GPU服务器并行组成,所述1U GPU服务器并行连接有三路相互独立的数据线路且三路相互独立的数据线路与管理节点装置相连,所述1U GPU服务器的三路数据线路为IPMI远程管理线路、40Gb Infiniban计算网线路和千兆以太网线路,所述IPMI远程管理线路与千兆以太网交换机相连,所述千兆以太网线路与千兆以太网交换机相连,所述千兆以太网交换机通过千兆以太网线路与并行存储系统相连,所述并行存储系统设置有两路相互独立的10Gb Infiniban存储网路线路,其中一路10Gb Infiniban存储网路线路与10Gb Infiniband交换机相连,另一路10Gb Infiniban存储网路线路与40Gb Infiniband交换机相连,所述并行存储系统通过千兆以太网线路与40Gb Infiniband交换机相连,所述40Gb Infiniband交换机与40Gb Infiniban计算网线路相连。
进一步地,上述的应用于电磁仿真的GPU高性能计算平台装置,其中,管理节点装置为2U双路服务器。
更进一步地,上述的应用于电磁仿真的GPU高性能计算平台装置,其中,GPU计算机节点和管理节点安装在机柜中。
再更进一步地,上述的应用于电磁仿真的GPU高性能计算平台装置,其中,并行存储系统由数据索引控制器(MDC)、数据存取模块(IOM)和智能存储单元(SSU)组成。
本发明技术方案的实质性特点和进步主要体现在:
本发明通过GPU高性能计算平台来提升电磁方面的计算的性能,以达到最短时间内达到最高的科研成果,从而提高IT投资回报,提高生产效率。
附图说明
下面结合附图对本发明技术方案作进一步说明:
图1:本发明的结构示意图。
具体实施方式
如图1所示,应用于电磁仿真的GPU高性能计算平台装置,包括GPU计算机节点1和并行存储系统5,GPU计算机节点1由58个1U GPU服务器11并行组成,1U GPU服务器11并行连接有三路相互独立的数据线路且三路相互独立的数据线路与管理节点2装置相连,1UGPU服务器11的三路数据线路为IPMI远程管理线路7、40Gb Infiniban计算网线路9和千兆以太网线路8, IPMI远程管理线路7与千兆以太网交换机3相连,千兆以太网线路8与千兆以太网交换机3相连,千兆以太网交换机3通过千兆以太网线路8与并行存储系统相5连,并行存储系统5设置有两路相互独立的10Gb Infiniban存储网路线路10,其中一路10Gb Infiniban存储网路线路10与10Gb Infiniband交换机6相连,另一路10Gb Infiniban存储网路线路10与40Gb Infiniband交换机4相连,并行存储系统5通过千兆以太网线路8与40Gb Infiniband交换机4相连,40Gb Infiniband交换机4与40Gb Infiniban计算网线路9相连。
管理节点2装置采用2U双路服务器,可以增加安全性,且还能提高性能。
GPU计算机节点1和管理节点2安装在机柜中,机柜要能满足一整机柜机器有良好的散热,同时还要能够有良好的空间和排线管道用来对机柜内的机器安装排线做到美观及方便管理。机柜内部还要能提供良好的供电系统,方便给机器供电。
GPU计算节点1采用1U GPU服务器11,其1UGPU服务器11内安装1片Nvidia Tesla C2075,Nvidia Tesla C2075不但可以提供更大的显存,而且开启ECC后的性能更提升了多达20%。
计算网络采用40Gb超高速Infiniband为计算数据通信网络,同时采用1Gb以太网络负载普通网络应用,两种网络互为备份,达成整体系统高可用性。
并行存储系统5可以轻松扩展超过PB 和超过 10TB/s 吞吐量的统一横向扩展存储解决方案。同时并行存储系统5还能提供充分的数据冗余保护和先进的自动分层体系,通过数量有限的高速SSD固态硬盘大幅提升整个存储系统的性能表现,使其空间使用率达到5/6,远超过其他镜像方案的1/2使用效率。全冗余构架,不存在单点故障源,前端网络以万兆以太网为主,另外可以配置千兆网络作为万兆网络的冗余。
并行存储系统5还可以正确识别由高速SSD构成的高速存储层,并可以将合适的数据放置在该高速层上。重要的是,该并行存储系统5可以设定多种不同的策略,既可以根据访问频繁度设置,又可以根据用户或者应用类型设置。
并行存储系统5由三部分构成,包括数据索引控制器(MDC)、数据存取模块(IOM)和智能存储单元(SSU),其中数据索引控制器负责处理并行文件系统中的数据索引请求,两台数据索引控制器互为冗余,保证并行文件系统的高可靠性,连入Infiniband计算网络,保证与计算节点的高访问带宽;数据存取模块负责处理并行文件系统中的数据请求,多台数据存取模块保证了计算节点数据请求的高性能,每台数据存取模块安装两个光纤网卡,互为冗余,与后端智能存储单元连接;2个智能存储单元实现了高速存储空间与大容量存储空间的结合,实际配置裸容量120TB SATA硬盘作为大容量存储空间,1. 6TBSSD硬盘作为高速存储空间,大容量存储空间持续读写性能不低于3GBps,高速存储空间随机IOPS不低于30K,在分级存储的配置方面,通过与作业调度系统结合,实现80%只须在运行脚本和启动程序时从磁盘阵列中读取一些小文件的作业可以使用高速存储空间,20%会有G级大小的文件存取的作业可以使用大容量存储空间。
该装置采用两套网络,该计算网络前端存储网络复用,使用的40G的Infiniband高速网络,管理网络采用千兆以太网,千兆以太网与40Gb Infiniband互为备份;后端并行存储系统5的网络以万兆以太网为核心,千兆以太网作为备份,前端存储网络的40Gb Infiniband与万兆以太网之前通过Mellanox的网关连接。
综上所述,本发明通过GPU高性能计算平台来提升电磁方面的计算的性能,以达到最短时间内达到最高的科研成果来实现软硬件最大程度的共享,从而提高IT投资回报,提高生产效率。
需要强调的是:以上仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
机译: 通过虚拟机(VM)分别以共享模式和专用模式同时使用计算平台的第一图形处理单元(GPU)和第二GPU
机译: 利用GPU使用率生成高性能计算系统检查点的GPU方法
机译: 利用GPU使用率生成高性能计算系统检查点的GPU方法