首页> 中文学位 >医学图像中非刚体配准的GPU优化研究
【6h】

医学图像中非刚体配准的GPU优化研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题背景及意义

1.2 配准技术的国内外研究进展

1.3 配准方法分类

1.3.1 按图象维数分类

1.3.2 按自动程度分类

1.4 用CUDA加速医学图像配准

1.5 GPU的计算优势

1.6 论文的主要工作及内容安排

第二章 CT数据弹性配准原理

2.1 薄板样条函数

2.2 一维的三次样条

2.3 一维样条插值函数演示

2.4 高维样条

2.5 样条配准的计算机实现

2.6 本章小结

第三章 CUDA软件集成

3.1 程序模块分析

3.2 GPU模块优化

3.3 GPU优化稀疏矩阵的LU分解

3.4 GPU优化线性方程组的Gauss顺序消去法求解

3.5 矩阵求逆及矩阵相乘的GPU优化

3.6 本章小结

第四章 优化调试与实验结果分析

4.1 访存优化

4.1.1 数据对齐

4.1.2 合并访问

4.2 bank conflict

4.3 稀疏矩阵运算优化

4.4 医学图像实验结果分析

4.4.1 初始版本分析

4.4.2 改版一

4.4.3 改版二

4.4.4 改版三

4.5 实验结果

4.6 本章小结

第五章 总结与展望

5.1 工作总结

5.2 展望

参考文献

附录

致谢

攻读硕士学位期间已发表、录用论文及参与科研项目情况

展开▼

摘要

配准是医学图像处理中的一项重要任务。在手术中可以实时地将超声图像与CT(Computed Tomography,计算机断层扫描),MRI(MagneticResonance Imaging,磁共振成像)数据利用配准技术相互映射,以弥补不同影像设备效果的缺陷。配准还可以帮助医生进行人体骨骼正畸术术前准备,如阿佩尔氏综合征(Apert Syndrome),小儿颅缝早闭的术前规划。医学图像的配准往往是一项费时的工作,本文阐述了一种利用GPU(GraphicProcessing Unit,图形处理器)优化基于薄板样条(Thin Plate Spline,TPS)医疗影像弹性配准任务的方法,其中包括医学图像配准技术的背景和意义,GPU的硬件逻辑,矩阵相乘的加速算法,TPS图像配准的基本原理,以及基于CUDA架构的配准实现。
  矩阵相乘算法的CUDA(Compute Unified Device Architecture,统一计算设备架构)实现是本次实验的重点和难点。我们的实验平台是INTEL至强E1230V2,8G内存,GTX460显卡。在实验中计算1000*1000规模的矩阵,经过访存、bank conflict、数据源优化后的CUDA矩阵相乘实现速度为0.025秒,相比初始CUDA实现为0.3286秒,加速比为13。由于配准点的数量决定参与计算的矩阵规模,我们还研究了配准点数量对计算速度的影响,实验证明MATLAB环境下,在2D图像中放置65个配准点的配准速度为0.0106秒,3个配准点的速度为0.0044秒;在VB.net2010平台,65个配准点,1G规模的3D CT体数据情况下程序配准用时3214秒,CUDA程序同样情况下配准用时70秒,加速比接近46。由于多核等技术可以让图像处理速度线性提升,不需要对源程序作大幅修改,选用最新GPU如英伟达Tesla K80,以及多GPU,多CPU的单台计算机有望达到加速比200,达到实时配准的效果。

著录项

  • 作者

    苏铭坚;

  • 作者单位

    广西大学;

  • 授予单位 广西大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 张学军,吴东波;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    医学图像; 配准技术; 图形处理器; 薄板样条;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号