首页> 外国专利> MONOCULAR 3D OBJECT LOCALIZATION FROM TEMPORAL AGGREGATION

MONOCULAR 3D OBJECT LOCALIZATION FROM TEMPORAL AGGREGATION

机译:基于时间聚集的单目三维目标定位

摘要

A method provided for 3D object localization predicts (610) pairs of 2D bounding boxes. Each pair corresponds to a detected object in each of the two consecutive input monocular images. The method generates (620), for each detected object, a relative motion estimation specifying a relative motion between the two images. The method constructs (630) an object cost volume by aggregating temporal features from the two images using the pairs of 2D bounding boxes and the relative motion estimation to predict a range of object depth candidates and a confidence score for each object depth candidate and an object depth from the object depth candidates. The method updates (640) the relative motion estimation based on the object cost volume and the object depth to provide a refined object motion and a refined object depth. The method reconstructs (650) a 3D bounding box for each detected object based on the refined object motion and refined object depth.
机译:一种用于三维对象定位的方法预测(610)对二维边界框。每对对应于两个连续输入单目图像中的每一个中的检测到的对象。该方法为每个检测到的对象生成(620)指定两个图像之间的相对运动的相对运动估计。该方法通过使用成对的2D边界框和相对运动估计来聚合来自两个图像的时间特征来构造(630)对象代价量,以预测对象深度候选范围、每个对象深度候选的置信分数以及来自对象深度候选的对象深度。该方法基于对象代价量和对象深度更新(640)相对运动估计,以提供细化对象运动和细化对象深度。该方法基于细化的对象运动和细化的对象深度,为每个检测到的对象重建(650)3D边界框。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号