首页> 外文期刊>電子情報通信学会技術研究報告 >正規化相互情報量に基づく非剛体位置合わせのCUDAによる高速化
【24h】

正規化相互情報量に基づく非剛体位置合わせのCUDAによる高速化

机译:CUDA基于标准化互信息加速非刚性注册

获取原文
获取原文并翻译 | 示例
       

摘要

This paper presents an acceleration method using the compute unified device architecture (CUDA), aiming at accelerating nonrigid registration based on normalized mutual information (NMI). Our method reduces the data size of joint histograms such that they can be stored in shared memory for fast computation of NMI. Furthermore, our method achieves rapid B-spline deformation by performing data reuse on shared memory. In experiments, we evaluated our method by using four datasets having 512 × 512 × 256 voxels. As a result, our method achieved a speedup of 1.3-1.4 by using shared memory. We also found that our method runs 6.1-6.9 times faster than a CPU-based implementation running on four cores.%本稿では,正規化相互情報量に基づく非剛体位置合わせの高速化を目的として,CUDA(Compute Unified Device Architecture)による高速化手法を提案する.提案手法は,正規化相互情報量を高速に計算するために,結合ヒストグラムのデータサイズを削減し共有メモリ上に格納する.また,再利用できる計算結果を共有メモリ上に格納することにより,高速なB-spline変形を実現する.実験では,512×512×256ボクセルからなる4例を用いて提案手法の性能を評価した.結果として,共有メモリの使用により1.3~1.4倍の速度向上を得た.また,4コア上で動作するCPU実装と比較して,6.1~6.9倍の速度向上を得た.
机译:本文提出了一种使用计算统一设备架构(CUDA)的加速方法,旨在基于归一化互信息(NMI)加速非刚性配准,我们的方法减小了联合直方图的数据大小,以便可以将它们存储在共享内存中,以实现快速存储。在实验中,我们通过使用四个具有512×512×256体素的数据集对本方法进行了评估,从而实现了B样条的快速变形。通过使用共享内存,我们可以达到1.3.1.4。我们还发现,该方法的运行速度比在四个内核上运行的基于CPU的实现快6.1-6.9倍。%在本文中,我们基于标准化的互信息加快了非刚性注册。为此,我们提出了一种使用CUDA(计算统一设备体系结构)的加速方法,该方法减小了组合直方图的数据大小并将其存储在共享内存中,以便高速计算归一化互信息。此外,通过将可重用的计算结果存储在共享内存中,我们实现了快速的B样条变换,在实验中,我们使用512×512×256体素的四个示例评估了该方法的性能。结果,使用共享内存获得了1.3到1.4倍的加速,并且与在4个内核上运行的CPU实现相比,我的速度提高了6.1到6.9倍。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号