基于多模态深度神经网络的深度恢复

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

深度恢复是计算机视觉领域的一个经典问题。近年来，基于深度神经网络的单视图深度恢复受到了学术界广泛关注。然而基于深度神经网络的单视图深度恢复往往只能生成模糊的估计结果，由于其固有的不适定性，无法恢复出准确一致的场景尺度。
　　为了解决这一问题，本文提出一种基于深度神经网络和多模态输入的深度估计模型，通过结合传统方法（立体匹配、硬件传感器等）得到的可靠深度区域，恢复得到更为准确且稠密的深度估计结果。该模型以RGB图像和稀疏但较为可靠的深度采样为输入，通过对抗学习的方法，提取来自输入的有效信息，并对场景深度进行建模，实现传统方法和基于深度神经网络单目预测方法的优劣互补，达到较好的深度恢复结果。
　　具体来说，提出的深度恢复模型分为两个主要部分:初始深度估计部分和深度求精部分，以由粗到精的方式实现场景深度估计。深度求精部分创新性地采用了尺度残差学习方法，大大提升了系统的性能。另外，为了排除训练数据中深度采集噪声对系统训练造成的影响，本文提出了一种稀疏判别网络，使得网络的训练过程更加稳定，预测结果更加可靠。
　　大量的实验结果证明，相比现有的其他基于深度神经网络的单视图深度预测方法，本文提出的方法无论在泛化能力还是预测准确性上都取得了显著提升。例如，就RMSE(均方根误差)一项而言，本文方法的深度估计误差在NYU-Depth-V2数据集[1]上降低了0.39米，在KITTI深度预测数据集[2]上降低了0.85米。除此之外，本文成功将本方法应用于场景深度恢复、雷达（LiDAR）数据补全和三维场景重建等应用场景，进一步验证了模型的实用性和可靠性。

著录项

作者
许龑;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机科学与技术
授予学位硕士
导师姓名章国锋,鲍虎军;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
深度恢复; 生成对抗网络; 三维视觉;

相似文献

中文文献
外文文献
专利

1. 基于深度神经网络的多模态信息检索 [J] . 李光宇 . 计算机应用与软件 . 2022,第1期
2. 基于深度神经网络的多模态特征自适应聚类方法 [J] . 敬明旻 . 计算机应用与软件 . 2020,第010期
3. 基于深度神经网络多模态融合的颞叶内侧癫痫鉴别 [J] . 钟霁媛 ,陈思翰 ,王晗 . 现代计算机（专业版） . 2019,第019期
4. 基于SAE深度神经网络的自主循环恢复辨识算法研究 [J] . 张广 ,王宗阁 ,王平安 . 医疗卫生装备 . 2021,第009期
5. 基于深度神经网络估计深度信息的视觉SLAM研究 [C] . Zhao Xin ,赵鑫 ,Han Yinhe . 第十七届全国容错计算学术会议 . -1
6. 基于深度神经网络的多模态语音识别 [A] . 胡晓凯 . 2018

基于多模态深度神经网络的深度恢复

目录

摘要

著录项

相似文献

相关主题

期刊订阅