首页> 中文学位 >基于深度神经网络的视觉位姿估计方法研究
【6h】

基于深度神经网络的视觉位姿估计方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究背景

1.2 课题研究意义

1.3 国内外研究现状

1.4 本文研究工作

1.5 章节安排

第2章 相关研究介绍

2.1 深度学习简介

2.1.1 深度学习特点

2.1.2 卷积神经网络的结构

2.1.3 模型优化算法

2.1.4 卷积神经网络的训l练

2.2 视觉SLAM技术介绍

2.2.1 经典视觉SLAM框架

2.2.2 位姿估计模型

2.2.3 光束平差法

2.3 本章小结

第3章 位姿估计问题描述

3.1 问题描述

3.1.1 数学描述

3.1.2 算法框架概述

3.2 数据集及性能指标

3.2.2 数据增强

3.2.3 预处理

3.2.4 算法性能指标

3.3 本章小结

第4章 基于双流卷积神经网络的位姿估计方法

4.1 引言

4.2 网络模型

4.2.1 稠密光流

4.2.2 网络结构

4.2.3 网络训练

4.3 误差学习

4.4 实验及分析

4.4.1 实验基本设置

4.4.2 模型性能效果分析

4.4.3 模型性能效果对比

4.4.4 其他实验

4.5 本章小结

第5章 基于端到端学习的位姿估计方法

5.1 引言

5.2 网络模型

5.2.1 网络结构设计

5.2.2 损失函数

5.2.3 网络训练

5.3 实验及分析

5.3.1 实验基本设置

5.3.2 模型预测性能分析

5.3.3 模型预测效果对比

5.3.4 模型耗时性能测试

5.4 本章小结

第6章 总结与展望

6.1 论文总结

6.2 未来展望

参考文献

致谢

在读期间发表的学术论文与取得的研究成果

展开▼

摘要

视觉位姿估计是指利用附属于运动体(如车辆、机器人等)的视觉传感器采集的图像数据来估计其位姿变换的过程,是基于视觉技术的定位导航、三维重建、轨迹推算等领域的重要研究方向。该工作目前主要集中在视觉里程计的算法研究中,是视觉SLAM系统的关键构成模块,具有广泛的应用场景。
  通常,视觉里程算法计沿袭了特征提取、特征匹配和追踪定位的经典流程,并利用其它优化策略调优。但是面对复杂场景时,该类方法往往存在稳定性不足的缺点。深度学习技术在处理图像理解任务时表现出强大的特征抽象和表达能力,为视觉位姿估计问题提供了新的研究思路。该方法能够从训练数据中学习相机位姿的表征方式,不需要依赖任何相机参数,而且能够学习到场景的真实尺度,具有传统方法不具备的优势。因此,本文针对基于深度神经网络的单目视觉位姿估计方法进行研究,并完成以下工作:
  1.结合任务性质和深度学习特点,将单目视觉位姿估计问题建模为一种有监督的回归学习问题,进行分析和设计整体算法框架,并根据特征表达方式的不同将该问题分为两个层面进行研究。
  2.利用稠密光流能够表征帧间运动信息的特性,提出了一种基于双流卷积神经网络的位姿估计模型。该方法将以图像帧和光流图为输入的卷积神经网络进行级联以完成特征提取,利用共享的全连接层和欧氏距离损失函数直接预测帧间位姿向量,进而构建位姿回归模型。该方法既简化了特征提取过程,又能够融合不同层次的特征,提高了模型的预测精度。
  3.进一步地,对上述算法进行改进,设计了一种基于端到端学习的位姿估计模型。该算法模型仅以图像帧作为输入,融合光流提取网络和位姿估计网络,利用自编码网络重构光流场,提高光流特征的鲁棒性。通过位姿估计误差和光流重构误差双重约束,保证网络的训练效果,提高模型的位姿估计性能。同时,该算法将特征提取过程在深度学习框架下实现,无需引入外部算法,这种端到端的训练方式使得模型有潜力得到性能上的整体提升。
  综上,本文基于深度神经网络逐步设计实现了端到端的位姿估计模型,并在公开数据集上设计仿真实验,实验结果表明该算法在各项性能指标上均具有较好的效果,避免了外部参数依赖,同时能够估计真实尺度,具有实际应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号