首页> 中国专利> 一种高速服务区密集行人检测方法

一种高速服务区密集行人检测方法

摘要

一种高速服务区行人的检测方法,包括如下步骤:1)制作高速服务区密集行人数据集,并利用pycococreate工具包转化为COCO数据集,确定使用改进的FCOS算法进行检测。2)使用目标中心点到边界框四条边的距离将特征图分割为四个部分,并从中随机选取部分特征图,放大该特征切块区域,将其上采样至原特征图大小,之后再将另一部分特征区块以左上‑左下、左上‑右上等方式进行组合,最后把所有处理后的特征切块图像一起送入maxout单元,训练网络能够更好地兼顾局部信息和全局信息。3)对FCOS中采用的损失函数进行优化。本发明能够改进FCOS算法检测密集行人时效果不佳的问题,大幅提高了目标检测的准确率。

著录项

  • 公开/公告号CN113111732A

    专利类型发明专利

  • 公开/公告日2021-07-13

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202110311663.5

  • 发明设计人 邵奇可;陈一苇;颜世航;

    申请日2021-03-24

  • 分类号G06K9/00(20060101);G06K9/32(20060101);G06K9/46(20060101);G06N3/04(20060101);G06N3/08(20060101);G06T7/11(20170101);

  • 代理机构33201 杭州天正专利事务所有限公司;

  • 代理人王兵

  • 地址 310014 浙江省杭州市下城区潮王路18号

  • 入库时间 2023-06-19 11:49:09

说明书

技术领域

本发明属于图像识别与计算机视觉技术领域,涉及的是一种高速服务区密集行人检测方法。

背景技术

行人检测是计算机视觉领域的一个研究热点,常与行人跟踪、行人重识别等技术结合,应用于汽车无人驾驶系统、人体行为分析、智能视频监控、客流统计系统等诸多领域。随着深度学习技术的火热发展,行人检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。该项技术能够更好地提取特征,利用多层计算模型学习抽象的数据表示,发现大数据中的复杂结构,从而找出图像中所有感兴趣的物体,并确定物体的类别和位置。为加强高速公路服务区的管理,推进智慧服务区建设,将行人检测技术应用于高速公路服务区监管系统,从而高效准确地完成服务区内人流量信息、公共秩序违规事件、车流量信息等的实时发布与告警,能够提升服务区服务质量与智能管理水平,减少大量人力资本的消耗,具有重要的现实意义。

由于人体具有各种姿态和形状,其外观受视角、姿态、服饰、成像距离等影响非常大,且在高速服务区中,行人分布非常密集,导致目标通常存在严重的遮挡,这使得行人检测成为计算机视觉领域中一个极具挑战性的课题。

基于深度学习提取的特征通常具有很强层次表达能力,因此深度卷积神经网络被广泛应用于行人检测以解决一些视觉问题。目前主流的检测算法主要分为一阶段目标检测和二阶段目标检测两个方向,两者的主要区别在于,二阶段检测算法需要先生成候选框,再进行细粒度的物体检测,这类算法以FasterR-CNN、Mask R-CNN等为代表,在检测精度方面表现得非常亮眼。而一阶段检测算法直接在网络中提取特征用以检测目标的位置及类别。以SSD、Yolo、FCOS等为代表,这类算法在保证精度的同时,一般拥有更快的检测速度。FCOS(FCOS:Fully Convolutional One-Stage Object Detection)是以逐像素预测的方式解决目标检测问题的一种全卷积一阶段目标检测算法,它通过引入逐像素回归预测、多尺度特征以及Center-ness三种策略,在简化计算过程、提升处理速度的同时,还保证了检测精度。然而,对于现实场景行人多发遮挡与重叠的问题,FCOS算法虽采用FPN多尺度策略来加以改进,但其仅能识别出尺寸差异较大的重叠物体,在复杂场景下,如在高速服务区密集行人检测时的效果尚不理想。

发明内容

本发明要克服FCOS算法模型对于高速服务区行人检测效果不佳的缺点,提供一种一种高速服务区密集行人检测方法。

本发明内容包括通过采用分割特征图思想提高模型抗遮挡能力,以及优化损失函数从而提升模型的识别精度。

FCOS算法采用基于FPN的多尺度检测策略,在特征层划按不同尺寸划分出五个特征区间,当同一区间内有目标发生重叠时,直接选取最小区域作为回归目标,从而区分开尺寸差距较大的重叠物体。这种做法虽然提升了检测速度,但同时也带来了不可忽视的问题,即难以检测出尺寸相近的重叠物体。

因此,本发明提出了一种基于特征图分割思想的高速服务区密集行人检测方法,该方法使用目标中心点到边界框四条边的距离将特征图分割为四个部分,并从中随机选取部分特征图,放大该特征切块区域,将其上采样至原特征图大小,之后再将另一部分特征区块以左上-左下、左上-右上等方式进行组合,最后把所有处理后的特征切块图像一起送入maxout单元,训练网络在不丢失局部信息的同时,也能兼顾全局信息。由于在复杂的场景下经常发生目标对象被另一目标对象遮挡的情况,那么经由分割后筛选出来的特征会更符合真实场景,选取出的候选区域也更可信。最后优化损失函数提高模型的检测精度。

本发明的一种高速服务区密集行人检测方法,包括如下步骤:

Step1:构建COCO格式的高速服务区密集行人数据集。根据密集行人检测的需求,准备符合要求的行人训练集M及相对应的mask文件,导入pycococreate-master工具包,并添加COCO格式的数据信息,编译后得到的JSON文件即包含训练集M中所有目标的坐标,符合训练需要。同法制作验证数据集V。

Step2:采用特征图分割思想,以L

其中,(x,y)代表目标中心点的坐标,(x

P表示图像经分割或组合后的部分,如左-右(l/r)、下-上(b/u)和comb(l/r与b/u的组合),*为卷积操作。再将组合后的图像信息送入maxout单元中,由于该函数是非线性的,所以可使网络逼近任意的函数。取max可融合

这种分割特征图的做法,利用了横向空间上的空间不变性,从而揭示不同方向上的语义关系。在对高速服务区的密集行人进行检测时,经常发生目标对象被另一目标对象遮挡的情况,那么分割后的特征会更符合真实场景,且能增强目标跟踪的抗遮挡性。

Step3:采用基于FPN的多尺度检测策略,在每个特征层加以回归区间的限定。具体做法为:以参数m

再分别取m

Step4:对FCOS算法使用的损失函数进行优化。原损失函数包含分类Loss和回归Loss,公式如下。

其中,cls表示分类Loss,使用的是Focal Loss,公式如下。

FL(p

L

但IoU函数仅关注两个目标的重叠程度,当两个目标不相交时,即A∩B=0时,IoU的值永远等于0,无法反映两个目标之间的距离变化。基于以上结论,将IoU Loss优化为GIoU Loss,公式如下。

L

其中,

优化后,L

本发明的优点是:解决了FCOS算法对于密集目标检测效果不佳的问题,提高了服务区行人检测精度。

附图说明

图1是本发明的特征图分割流程图。

图2是本发明的卷积神经网络中损失函数结构图。

图3是本发明给出的检测方法部署流程图。

具体实施方式

为了更好的说明本发明的技术方案,下面结合附图,通过一个实施例子,对本发明做进一步说明。

一种基于特征图分割思想的高速服务区密集行人检测方法,包括如下步骤:

Step1:根据密集行人检测的需求,自制一个包含较多重叠目标的密集行人训练集。由于FCOS算法原生支持COCO数据集及pascal VOC数据集格式,所以需要将自制的密集行人数据集转换为COCO数据集格式。构建密集行人数据集的数量为47234张,其中训练数据集33251张,验证数据集13983张。设定学习速率为0.00001,权重衰减系数为0.00001,步长为(60000,80000),最大迭代次数为90000,批次数为8。

Step2:设定不同的缩放因子,如S=1.2、S=0.7等对候选区域进行不同比例的缩放,以提高其多样性,由于经过缩放处理后的候选区域,会产生局部图像大于原图的问题,且产生了大量无效图像,因此需要再加上一层RoI采样层,对预测框进行筛选处理,滤除置信度得分低的预测框,接着对各层得到的特征图,采用特征图分割思想,以L

完成特征图分割后,再从中选取部分特征图,放大该特征切块区域,将其上采样至原特征图大小,之后再将另一部分特征区块以左上-左下、左上-右上等方式随机组合,完成目标信息集成,分割过程见图1。

Step3:采用基于FPN的多尺度检测策略,在每个特征层加以回归区间的限定。对P3层设置筛选尺寸为100×128/8,步长为1,回归区间为(0,64);对P4层设置筛选尺寸为50×64/16,步长为1,回归区间为(64,128);对P5层设置筛选尺寸为25×32/32,步长为1,回归区间为(128,256);对P6层设置筛选尺寸为13×16/64,步长为2,回归区间为(256,512);对P7层设置筛选尺寸为7×8/128,步长为2,回归区间为(256,+∞)。最终再对这五个尺度做逐像素回归。

Step4:对FCOS算法使用的损失函数进行优化,优化后的损失函数见图2。原损失函数包含分类Loss和回归Loss,公式如(4-1)所示。

由于IoU函数仅关注两个目标的重叠程度,当两个目标不相交时,IoU函数无法反映两个目标之间的距离变化。基于以上结论,引入关注目标远近距离且能够在训练时偏向重叠区域增多的方向移动的损失函数,将IoU Loss优化为GIoU Loss,以提高算法对重叠物体的检测精度。公式如(4-4)(4-5)(4-6)(4-7)所示。

优化后,L

以上阐述的是本发明给出的一个实施例表现出的优良优化效果,显然本发明不只是限于上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及范围的前提下对其可作种种变形加以实施。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号