首页> 中文学位 >卷积检测模型的GPU加速研究
【6h】

卷积检测模型的GPU加速研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景与意义

1.2研究现状

1.3研究内容与主要工作

1.4章节安排

第二章 主流卷积检测模型

2.1形变部件模型

2.2卷积神经网络

2.3本章小结

第三章 卷积检测模型的频域加速

3.1频域加速算法

3.2算法基本流程

3.3实验结果与分析

3.4本章小结

第四章 卷积检测模型的GPU加速

4.1 OpenCL简介

4.2算法并行性分析

4.3 GPU并行实现与优化

4.4实验结果与分析

4.5本章小结

第五章 HOG特征的GPU加速

5.1 HOG特征概述

5.2 GPU并行实现与优化

5.3实验结果与分析

5.4本章小结

第六章 总结与展望

6.1本文工作总结

6.2后续研究展望

参考文献

致谢

攻读硕士学位期间已发表或录用的论文

声明

展开▼

摘要

近年来,形变部件模型和卷积神经网络等卷积检测模型在目标检测领域取得了极大的成功。这类模型能够进行大规模的机器学习训练,实现较高的鲁棒性和识别性能。然而训练和检测过程中卷积运算巨大的计算开销,却限制了其在诸多实际场景中进一步地应用。幸运的是,GPU通用并行计算技术日益成熟,为加速卷积检测模型提供了可行的解决方案。
  本文在深入研究卷积检测模型,分析其性能瓶颈后,本文在不损失检测精度的前提下,利用数学理论和并行技术对卷积检测模型实现了算法和硬件的双重加速。在算法层面,通过应用卷积定理,将空间域中的卷积运算转换为频率域中的点乘运算来降低模型计算复杂度,同时利用启发式装箱算法有效地平衡了存储开销和计算开销之间的矛盾。在PASCAL VOC数据集上的实验表明,此频域加速算法能够在保证检测精度的情况下有效地加速卷积检测模型。在硬件层面,分析频域加速算法并行性的基础上,使用OpenCL对其进行了GPU加速实现,并采用内存访问优化、数据传输优化、控制流优化等OpenCL优化方法提高GPU实现的性能。实验结果表明,相对于传统CPU实现,本文GPU实现能够加速效果明显,而相对于完善优化的CPU实现亦能有一定的性能提升。此外,研究了HOG特征的GPU加速实现和优化问题。实验结果表明,本文GPU实现相比于CPU能够取得一定的加速效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号