Transformer与CNN融合的单目图像深度估计

张涛; 张晓利; 任彦

首页> 中文期刊> 《哈尔滨理工大学学报》 >Transformer与CNN融合的单目图像深度估计

Transformer与CNN融合的单目图像深度估计

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对单目视觉图像深度估计时存在精度低的问题,提出一种Transformer和CNN融合的单目图像深度估计方法。首先,采用ResNet-50作为编码器-解码器网络的主干网络对图像特征进行提取,同时在编码器-解码器网络中采用层级融合的方法,将编码器各层级特征进行融合作为解码器的输入,提升深度估计网络对多尺度特征信息的利用率。其次,采用Transformer网络对解码器的输出特征进行全局分析,Transformer网络中的多头注意力机制从解码器输出的深层特征中估计深度信息,提高深度估计网络对多尺度特征的提取能力进而提高深度图的精准度。在NYU Depth-v2数据集上完成模型有效性验证。实验结果表明,与多尺度卷积神经网络相比,该方法在精度δ<1.25上提高24.3%,在均方根误差指标上降低61.3%。证明其在单目图像深度估计的可行性。

著录项

来源
《哈尔滨理工大学学报》 |2022年第6期|88-94|共7页
作者
张涛; 张晓利; 任彦;
展开▼
作者单位

内蒙古科技大学信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
卷积神经网络; 编码器-解码器; TRANSFORMER; 深度估计; 单目视觉;

相似文献

中文文献
外文文献
专利

1. 基于CNN特征提取和加权深度迁移的单目图像深度估计 [J] . 温静 ,安国艳 ,梁宇栋 . 图学学报 . 2019,第002期
2. 基于CNN特征提取和加权深度迁移的单目图像深度估计 [J] . 温静1 ,安国艳1 ,梁宇栋1 . 图学学报 . 2019,第002期
3. 基于多尺度特征融合的快速单目图像深度估计 [J] . 孔慧芳 ,房亮 . 合肥工业大学学报:自然科学版 . 2022,第3期
4. 融合自监督单目图像深度估计的视觉里程计 [J] . 成立明 ,陈建新 ,陈瑞 . 计算机工程与应用 . 2021,第15期
5. 多层级特征融合结构的单目图像深度估计网络 [J] . 贾瑞明 ,李阳 ,李彤 . 计算机工程 . 2020,第12期
6. 利用单目图像进行人体运动姿势的估计 [C] . 仝明磊 ,潘海朗 ,刘允才 . 第十二届全国图象图形学学术会议 . 2005
7. 基于深度学习的单目图像深度估计问题研究 [A] . 李智宏 . 2021

Transformer与CNN融合的单目图像深度估计

摘要

著录项

相似文献

相关主题

期刊订阅