声明
摘要
图目录
表目录
第一章绪论
1.1研究背景和意义
1.1.1研究的背景
1.1.2研究的意义
1.2国内外研究现状及趋势
1.2.1 并行计算在Wallis影像增强中的研究现状
1.2.2 并行计算在Harris角点提取中的研究现状
1.2.3 并行计算在相关系数影像匹配中的研究现状
1.2.4并行计算在SIFT特征匹配中的研究现状
1.2.5国内外GPU通用计算发展现状
1.3研究内容和研究方案
1.3.1研究内容
1.3.2研究方案
第二章GPU通用并行计算
2.1 选择研究平台的技术基础
2.1.1 单核微处理器的发展
2.1.2多核微处理器的发展
2.1.3众核图形处理器的发展
2.2 GPU并行计算演进
2.2.1 GPU
2.2.2 GPGPU
2.2.3 GPU计算
2.3 GPU体系架构
2.3.1 Tesla 2并行计算结构
2.3.2 Tesla 2的TPC架构
2.3.3 Tesla 2的SM架构
2.4 CUDA构架
2.4.1 CUDA软件环境
2.4.2 CUDA编程模型
2.4.3 CUDA存储器模型
2.4.4 CUDA执行模型
2.5 基于CPU+GPU异构计算的影像处理通用并行解决方案
2.5.1主-从设计模式
2.5.2任务分解模式
2.5.3 负载均衡策略
2.6本章小结
第三章多GPUs加速的Wallis变换影像增强并行算法
3.1 Wallis滤波器及其特性
3.2双线性插值算法描述
3.3 Wallis影像增强多粒度混合并行算法的分析与设计
3.3.1 Wallis影像增强并行计算模型
3.3.2 多GPUs粗粒度并行
3.3.3数据块中粒度并行
3.3.4线程细粒度并行
3.4 Wallis并行算法GPU高性能分析与设计
3.4.1 实现最大化的存储器带宽
3.4.2优化存储器性能
3.5实验结果及分析
3.5.1实验步骤与数据记录
3.5.2 GPU与CPU结果一致性实验与分析
3.6并行算法性能分析
3.7本章小结
第四章基于GPU的Harris角点检测多设备控制并行算法
4.1 Harris角点提取算子
4.2 Harris角点提取并行算法分析与设计
4.2.1 Harris角点检测并行算法执行模式
4.2.2影像空间并行
4.2.3卷积并行
4.2.4 SIMT计算
4.3 Harris并行算法GPU高性能分析与设计
4.3.1 最优方式组织存储器访问
4.3.2利用纹理存储器提速
4.4实例计算及结果讨论
4.4.1实验步骤与数据记录
4.4.2 GPU与CPU结果一致性实验与分析
4.5并行算法性能分析
4.6 本章小结
第五章基于CUDA的相关系数影像匹配并行算法
5.1相关系数测度
5.2 影像匹配并行算法分析与设计
5.2.1影像匹配并行算法架构
5.2.2设备级并行计算分析
5.2.3任务级并行计算分析
5.2.4线程级并行计算分析
5.2.5共享存储器内的精细粒度并行分析
5.3影像匹配GPU并行算法性能优化
5.3.1 利用高速存储器进行优化计算
5.3.2利用常数存储器进行优化计算
5.3.3利用全局存储器进行优化计算
5.4.1实验步骤与数据记录
5.4.2 GPU与CPU结果一致性实验与分析
5.5并行算法性能分析
5.6本章小结
第六章面向群核CPU+GPU的SIFT特征匹配并行算法
6.1 SIFT算子描述
6.1.1建立多尺度空间
6.1.2尺度空间关键点检测及精确定位
6.1.3关键点方向参数的确定
6.1.4提取特征描述符
6.1.5 SIFT特征匹配
6.2 SIFT特征匹配并行算法分析与设计
6.2.1 SIFT特征匹配并行算法总体设计
6.2.2 基于CUDA的并行化数据结构
6.2.3线程的任务分配及映射策略
6.2.4流管理
6.3 SIFT特征匹配并行算法优化配置
6.3.1访存优化和数据复用
6.3.2 GPU线程同步优化
6.4测试结果与分析
6.4.1 GPU性能实验结果
6.4.2 GPU与CPU结果一致性实验与分析
6.5并行算法性能分析
6.6本章小结
第七章影像匹配系统集成实验与分析
7.1 影像匹配系统集成方案
7.2实验结果及数据
7.2.1 WHR影像匹配实验
7.2.2 WS影像匹配实验
7.3系统性能分析
7.3.1 WHR影像匹配系统性能分析
7.3.2 WS影像匹配系统性能分析
7.4本章小结
第八章总结与展望
8.1研究工作总结
8.2主要贡献与创新点
8.3进一步的工作与展望
8.4 结语
参考文献
攻读博士期间发表的论文及科研情况
致谢
武汉大学;