首页> 美国卫生研究院文献>Sensors (Basel Switzerland) >Fast CNN Stereo Depth Estimation through Embedded GPU Devices
【2h】

Fast CNN Stereo Depth Estimation through Embedded GPU Devices

机译:通过嵌入式GPU设备进行快速CNN立体声深度估计

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Current CNN-based stereo depth estimation models can barely run under real-time constraints on embedded graphic processing unit (GPU) devices. Moreover, state-of-the-art evaluations usually do not consider model optimization techniques, being that it is unknown what is the current potential on embedded GPU devices. In this work, we evaluate two state-of-the-art models on three different embedded GPU devices, with and without optimization methods, presenting performance results that illustrate the actual capabilities of embedded GPU devices for stereo depth estimation. More importantly, based on our evaluation, we propose the use of a U-Net like architecture for postprocessing the cost-volume, instead of a typical sequence of 3D convolutions, drastically augmenting the runtime speed of current models. In our experiments, we achieve real-time inference speed, in the range of 5–32 ms, for 1216 × 368 input stereo images on the Jetson TX2, Jetson Xavier, and Jetson Nano embedded devices.
机译:当前基于CNN的立体声深度估计模型几乎无法在嵌入式图形处理单元(GPU)设备上的实时约束下运行。此外,最新的评估通常不考虑模型优化技术,因为尚不清楚嵌入式GPU设备当前的潜力是什么。在这项工作中,我们评估了使用和不使用优化方法的三种不同嵌入式GPU设备上的两个最新模型,并给出了性能结果,这些结果说明了嵌入式GPU设备用于立体声深度估计的实际功能。更重要的是,基于我们的评估,我们建议使用类似于U-Net的体系结构来对成本量进行后处理,而不是典型的3D卷积序列,从而大大提高当前模型的运行速度。在我们的实验中,对于Jetson TX2,Jetson Xavier和Jetson Nano嵌入式设备上的1216×368输入立体声图像,我们实现了5–32 ms的实时推理速度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号