近年,グラフィックプロセッサ(Graphic Processing Unit,以下GPU)の一般目的への利用(General Purpose computation using on GPUs,以下GPGPU)の普及が進み,複数のGPUを利用する方式がハイパフォーマンスコンピューティングの分野において一般的になってきた.しかしながら,ノードをまたいだGPU同士の通信はそれぞれのホストCPUのメモリを介した間接的通信を行う必要があり,通信遅延が大きい点が問題である.そこで,筑波大学計算科学研究センターは,GPU同士の直接通信を可能とするPEACH2(PCI-Express Adaptive Communication Hub 2)を利用することで複数のGPUを密に接続することができる密結合並列演算加速機構(Tightly Coupled Accelerators,TCA)を提案した.PEACH2は,PCIeを用いて複数のノードを直接接続し,DMAによる低遅延,高バンド幅のデータ転送が可能なスイッチである.本報告では,このPEACH2を用いたマルチGPUシステムにGraph500の幅優先探索プログラムを実装し,一般的なマルチGPUシステムで用いられるMPIを利用する幅優先探索プログラムとの比較を行った.
展开▼