首页> 中文学位 >基于单帧图像的三维目标检测与定位深度学习方法研究
【6h】

基于单帧图像的三维目标检测与定位深度学习方法研究

代理获取

目录

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 基于多视图的三维目标检测方法

1.2.2 基于单帧图像的三维目标检测方法

1.2.3 基于雷达点云的三维目标检测方法

1.3 研究内容及章节安排

2 基于深度神经网络的智能驾驶目标识别方法

2.1 引言

2.2.1 深度神经网络概述

2.2.2 深度卷积神经网络模型

2.3 基于深度学习的单帧图像三维目标检测算法

2.3.1 网络结构分析及损失函数

2.3.2 网络实验结果及分析

2.4 本章小结

3 新型单帧图像三维目标检测神经网络算法

3.1 引言

3.2 MoNet3D算法

3.2.1 整体网络结构

3.2.3 水平几何局部性保持正则化方法

3.2.3 MoNet3D的子网络与其损失函数

3.3.1 实验设置

3.3.2 三维目标定位结果分析

3.3.3 三维目标识别结果分析

3.4 本章小结

4 车载目标检测与定位系统实现

4.1 引言

4.2.1 视觉模组设计

4.2.2 数据采集

4.3.1 系统软件设计

4.3.2 嵌入式系统实现

4.3.3 系统验证与测试

4.4 本章小结

5 总结和展望

5.1 工作总结

5.2 工作展望

参考文献

附录

C. 学位论文数据集

致谢

展开▼

摘要

近年来,随着汽车行业的高速发展,交通事故的发生也在逐年增长。汽车高速行驶下的追尾事故已经是造成全球交通事故发生的首要原因,因此导致的死亡人数也在所有交通事故中排在了首位。为了减少交通事故的发生,高级驾驶辅助系统已经受到了人们越来越多的关注。高级驾驶辅助系统的核心在于环境感知,利用诸如摄像头、激光雷达、毫米波雷达等传感器对道路周围的环境进行感知,检测道路前方的车辆,并对即将到来的碰撞发出预警。传统方法检测车辆需要人为预先设定并提取相应特征,存在着准确率较低抗干扰能力弱等缺陷。如今利用计算机视觉领域中的卷积神经网络进行三维目标检测,已经成为该领域愈发火热的一个研究方向。  尽管基于单帧图像的方法在计算速度和成本上有着巨大的优势,但与基于激光雷达的方法相比,目前基于单帧图像的三维目标检测的准确率还比较低。在广泛使用的KITTI标准测试集中,基于单帧图像的3D目标检测准确率比基于激光雷达的方法要低63%。  本文研究了基于单帧图像的三维目标检测方法。在只有单帧图像、深度信息缺失的情况下,提出了一种新型的水平几何局部性保持的正则化方法,设计了面向高级驾驶辅助的MoNet3D神经网络架构,三维目标检测准确率由基准模型的13.88%提高到了21.80%。本文的具体工作与贡献如下:  ①设计了MoNet3D实时的单帧图像驾驶辅助三维目标检测与定位神经网络框架,实现了95.50%的平均定位精度。  ②提出了一种水平几何局部性保持的正则化方法,将目标的三维邻近关系先验知识引入深度神经网络训练过程,提高了目标的三维目标检测与识别的准确度。  ③设计了一套自动驾驶辅助原型计算系统,系统可以以每秒27.85帧的速度处理分辨率为1248×384的视频图像实现三维目标检测和定位。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号