首页> 中文学位 >基于YOLOv3算法的行人检测研究与优化
【6h】

基于YOLOv3算法的行人检测研究与优化

代理获取

目录

1 绪 论

1.1 研究背景与研究意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文的组织结构

2 目标检测相关理论

2.1 卷积神经网络

2.1.1 卷积层

2.1.2 激活函数

2.1.3 池化层

2.1.4 全连接层

2.2 反向传播算法

2.3 常见目标检测算法

2.3.1 R-CNN系列

2.3.2 SSD

2.4 迁移学习

2.5 目标检测常用评判指标

2.5.1 准确率和召回率

2.5.2 IoU

2.5.3 mAP

2.6 本章小结

3 基于多尺度特征融合改进YOLOv3算法

3.1 行人检测问题存在的挑战

3.2 多尺度特征融合

3.2.1 上采样

3.2.2 1 x 1卷积

3.2.3 特征金字塔网络

3.3 YOLOv3算法

3.3.1 YOLOv3算法的网络结构

3.3.2 损失函数

3.4 对YOLOv3算法的改进

3.4.1 基于自适应特征权重调节的特征融合方法

3.4.2 采用Kmeans++算法

3.5 实验及结果分析

3.5.1 数据集简介

3.5.2 实验参数设置

3.5.3 实验结果

3.6 小结

4 YOLOv3算法的边界框回归及NMS优化

4.1 边界框回归损失函数改进

4.1.1 边界框回归过程分析

4.1.2 基于中心点距离的边界框回归损失函数

4.2 NMS算法及其改进

4.2.1 NMS算法介绍

4.2.2 Soft-NMS

4.2.3 Center_dis-NMS

4.3 实验及结果分析

4.3.1 数据集简介

4.3.3 实验结果

4.4 本章小结

5 基于改进YOLOv3算法的行人检测与优化

5.1 算法整体框架

5.2 优化策略

5.2.1 采用mix-up技术的预训练模型

5.2.2 多尺度训练策略

5.3 实验及结果分析

5.3.1 数据集简介

5.3.2 实验参数设置

5.3.3 实验结果

5.4 本章小结

6 总结与展望

6.1 研究工作总结

6.2 展望

参考文献

附 录

A. 学位论文数据集

致 谢

展开▼

摘要

行人检测作为目标检测的子问题,是计算机视觉领域的热门研究方向之一,在自动驾驶、视频监控、安防等领域有着巨大的应用价值,所以许多企业、高校都针对行人检测问题开展了研究。由于行人目标受许多因素影响,行人检测仍旧有很多困难和挑战:①行人检测需要很高的实时性来满足应用需求;②小尺寸行人(高度小于60像素)难以检测;③行人常常存在重叠、遮蔽。  基于以上问题,本文重点研究了基于YOLOv3网络进行改进的行人检测算法。改进后的YOLOv3算法可以在不同尺度特征层,更精准地探测不同高度大小的行人,并且能满足实时性高的要求。本文的主要工作包括以下内容:  ①基于多尺度特征融合改进了YOLOv3网络。为了充分利用底层特征的空间信息和高层特征的语义信息,在三个尺度上分别进行特征融合时,首先将除当前尺度特征层以外的两个特征层,更改到和此特征层一样的大小,然后通过1x1的卷积核,输出当前尺度3个权重参数,最后以此进行特征融合。在BDD100K行人数据集上,验证了基于YOLOv3算法并采用自适应特征融合及K-means++聚类算法,对不同高度行人的检测效果。  ②对YOLOv3算法的边界框回归损失函数与NMS算法的优化。为了获取更精确的预测框位置,采用基于中心点距离的边界框回归损失函数Center_dis-IoU代替YOLOv3算法损失函数中关于坐标损失的MSE损失,并使用Soft-NMS和Center_dis-IoU改进NMS算法来降低漏检率。随后在Pascal VOC2007数据集上,将损失函数中关于坐标的损失部分替换为新的边界框回归损失函数,验证其对训练收敛速度和边界框定位准确度的改进并使用Soft-NMS、Center_dis-IoU验证对于去除重复预测框的优化。  ③基于改进YOLOv3算法的行人检测实验与优化。联合这些改进,并采用基于mix-up策略训练得到的预训练模型权重,在BDD100K数据集上进行多尺度的训练。实验结果表明,模型的检测精度明显提高,漏检率大幅降低,有很高的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号