This paper presents an acceleration method using the compute unified device architecture (CUDA), aiming at accelerating nonrigid registration based on normalized mutual information (NMI). Our method reduces the data size of joint histograms such that they can be stored in shared memory for fast computation of NMI. Furthermore, our method achieves rapid B-spline deformation by performing data reuse on shared memory. In experiments, we evaluated our method by using four datasets having 512 × 512 × 256 voxels. As a result, our method achieved a speedup of 1.3-1.4 by using shared memory. We also found that our method runs 6.1-6.9 times faster than a CPU-based implementation running on four cores.%本稿では,正規化相互情報量に基づく非剛体位置合わせの高速化を目的として,CUDA(Compute Unified Device Architecture)による高速化手法を提案する.提案手法は,正規化相互情報量を高速に計算するために,結合ヒストグラムのデータサイズを削減し共有メモリ上に格納する.また,再利用できる計算結果を共有メモリ上に格納することにより,高速なB-spline変形を実現する.実験では,512×512×256ボクセルからなる4例を用いて提案手法の性能を評価した.結果として,共有メモリの使用により1.3~1.4倍の速度向上を得た.また,4コア上で動作するCPU実装と比較して,6.1~6.9倍の速度向上を得た.
展开▼