基于CPU+GPU的影像匹配高效能异构并行计算研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

多核CPU和图形处理器(Graphic Processing Unit，GPU)的高速发展，不但促进了图像处理、虚拟现实、计算机仿真等领域的快速发展，同时也为利用GPU进行图形处理以外的高性价比绿色通用计算提供了良好的运行平台。因此，GPU的通用计算已成为高性能计算领域中的热点研究课题之一。伴随着传感器技术的不断进步，致使人们获取地表信息的手段越来越多样快捷。面对数据源的多样化与数据量的成倍增长，许多常规算法很难满足对海量数据进行高速计算的要求。而现代图形硬件GPU日益增加的可编程性和高效能计算能力，则为摄影测量与遥感中可并行化算法的加速提供很大的空间。本文仅就GPU大规模并行计算影像匹配研究中的若干问题进行了详细的分析，并提出了相应的解决方案。具体工作概述如下: (1)通过对摄影测量与遥感领域中与影像匹配处理相关的四种算法在GPU上的并行处理进行研究，提出了基于CPU+GPU的异构群核架构的影像处理共通解决方案，探索了影像处理的GPU大规模并行计算设计模式。基于GPU的影像处理通用并行解决方案要在数据精度、延迟和计算量等几个方面进行GPU加速效果的预评估，算法设计和优化过程中也须采用功能和数据分解、线程映射等并行计算方法以及存储器访问优化、通信优化和指令流优化等优化策略。基于GPU的影像处理通用解决方案设计与性能优化是与GPU的体系结构、求解问题的特征结合在一起的，通常需要多重因素整体考虑并不断尝试，最终达到理想的性能。针对GPU与CPU的不同，重点分析和讨论了GPU的加速原理以及当前比较成熟的统一计算设备架构(Compute Unified Device Architecture，CUDA)通用计算模型构架及其特点。 (2)提出多GPUs加速的Wallis变换影像增强并行算法。借助于GPU较强的运算能力，利用CUDA并行计算架构在个人计算机(Personal Computer,PC)上实现了快速Wallis图像滤波算法，包括GPU上任务分解、大规模计算核心的分解方法，结合使用了共享存储器、全局存储器对算法进行加速。使用线程块内的共享存储器较好地解决了同一计算子空间的各线程同步问题。对比CPU和GPU计算Wallis影像变换的时间，实验结果表明，Wallis变换并行算法可以把计算速度提高2个数量级。该方法具有较好的实时性，可大大提高图像增强过程的处理速度，显著地减少计算时间。 (3)研究基于GPU的Harris角点检测多设备控制并行算法，使用众多线程将计算中耗时的图像高斯卷积平滑滤波部分改造成单指令多线程(Single Instruction Multiple Thread，SIMT)模式，并采用GPU中共享存储器、常数存储器和锁页内存机制在CUDA上完成图像角点检测的全过程。实验结果表明，基于多GPUs的Harris角点检测并行算法成功实现了硬件加速，相对于CPU上运行的Harris角点检测算法，其执行效率有近60倍的提高。 (4)提出基于CUDA架构的快速相关系数影像匹配并行算法，它能够在SIMT模式下完成高性能并行计算。并行算法系根据GPU的并行结构和硬件特点，采用执行配置技术、高速存储技术和全局存储技术三种加速技术，优化了数据存储结构，提高了数据访问效率。实验结果表明，并行算法充分利用了GPU的并行处理能力，速度是基于CPU实现的近20倍并能获得最高多处理器warp占有率。 (5)研究面向CPU+GPU群核架构的尺度不变特征变换(Scale Invariant Feature Transform，SIFT)特征匹配并行算法，优化了数据存储结构，提高了数据访问效率。实验结果表明，与SIFT特征匹配的串行CPU实现方式相比，CUDA实现能够实现超过27倍的性能加速，极大地提高了SIFT特征匹配算法在实际应用中的实时性。 (6)基于CPU+GPU的影像匹配系统集成研究。包括单GPU/多GPUs加速的Wallis-Harris-相关系数(WHR)影像匹配系统和单GPU/多GPUs加速的Wallis-SIFT(WS)影像匹配系统。实验结果表明，GPU加速的WHR影像匹配系统比CPU实现方法整体提速最高达37倍，GPU加速的WS影像匹配系统比CPU实现方法整体提速最高达39倍。

著录项

作者
肖汉;
展开▼
作者单位

武汉大学;

展开▼
授予单位武汉大学;
学科摄影测量与遥感
授予学位博士
导师姓名张祖勋,张剑清;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类交通工程与公路运输技术管理;计算技术、计算机技术;
关键词
CPU; GPU; 影像匹配; 高效能; 异构;

相似文献

中文文献
外文文献
专利

1. 基于CPU+GPU异构并行的QPSK开环解调方法研究 [J] . 顾祥龙 ,王元钦 ,韩丙寅 . 遥测遥控 . 2013,第004期
2. CPU+GPU异构并行的矩阵转置算法研究 [J] . 肖汉 ,李彩林 ,李琦 . 东北师大学报：自然科学版 . 2019,第4期
3. CPU+GPU异构并行计算技术研究 [J] . 李红辉 ,刘冬冬 ,杨芳南 . 信息系统工程 . 2018,第005期
4. 面向CPU＋GPU异构平台的模板匹配目标识别并行算法 [J] . 马永军 ,袁赢 ,李灏 . 天津科技大学学报 . 2014,第004期
5. CPU+GPU单机异构环境下遥感数据并行处理技术研究 [J] . 郭超 ,黄斐 ,姚珊 . 山东工业技术 . 2014,第004期
6. CPU+GPU异构并行多目标测试用例预优化技术 [C] . Cheng Jun ,程俊 ,Li Zheng . 第七届中国测试学术会议 . 2012
7. 基于CPU+GPU的图像处理异构并行计算研究 [A] . 吕向阳 . 2014

基于CPU+GPU的影像匹配高效能异构并行计算研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅