首页> 中国专利> 基于DCBFFNet的城市河道水上多目标检测方法与系统

基于DCBFFNet的城市河道水上多目标检测方法与系统

摘要

本发明公开了一种基于DCBFFNet的城市河道水上多目标检测方法与系统。首先从视频流中分别提取城市河道管理涉及水上对象的图像,进行降噪处理和标注,构建目标检测数据集;其次构建对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,该模型构建了面向多对象特性的特征层选择模块以及基于多尺度特征的密集双向特征融合模块,并设计了面向对象的多层特征图锚框尺寸;再基于最优的锚框尺寸和目标检测数据集,进行模型的迭代训练;最后基于训练好的模型实现水上对象的定位和类别预测。本发明通过端到端的模型训练可实现从数据集到目标检测的完整流程,用于城市河道水上多目标的定位和对象类别判断,为城市河道健康管理的及时响应提供智能化方法。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):G06V20/40 专利申请号:2022103091098 申请日:20220328

    实质审查的生效

说明书

技术领域

本发明属于图像处理技术领域,具体涉及一种基于深度学习模型DCBFFNet(Densely Connected Bidirectional Feature Fusion Network,简称DCBFFNet)的城市河道水上多目标检测方法与系统。

背景技术

在河湖健康管理方面,河面漂浮物的及时发现和打捞非常重要,可避免漂浮物堆积造成的水环境污染。早期常用的漂浮物检测方法如背景差分法和帧间差分法等,主要是围绕底层特征和中层特征(如颜色、纹理等)进行的,采用特征提取与分类器相结合的方式进行检测。在多类别的目标检测与识别任务中,需要多个分类器(如SVM)进行分类,这使得在训练分类器上耗费大量时间。这类检测方法是基于手工特征构建,受特征的选择、目标形态和背景变化的影响较大,鲁棒性和泛化能力较差。

随着深度学习的快速发展,基于深度学习的目标检测技术由于其强大的特征表达能力已经在多个领域得到广泛应用,如航天航空、机器人导航、智能安防和工业检测等领域,但由于水面环境复杂(如岸边倒影,目标倒影,水面等),水面目标种类多样,尺度变化大(小到塑料瓶大到船只),导致其在水利方面的应用效果不佳。在多类别水面目标检测与识别中,水面目标随水流堆积在一起,导致目标间存在遮挡,目标对象类别模糊,难以判断。一些小目标如塑料瓶、易拉罐等体积较小,占用的图像面积很小,与大目标相比,它们缺乏外观信息,且高层特征缺乏判别性,难以与背景进行区分并实现精确定位,增加检测难度。除此之外,从数据集方面来看,相比于单类别目标检测任务,多类别目标检测任务需要更高质量的数据集,除考虑总样本量外,还需考虑不同类别目标样本间的平衡,数据集中某一目标样本过多或过少都会影响检测模型的学习能力。因此需要研究一种新型的、性能优良的城市河道水上对象目标检测方法,实现从构建数据集到目标检测和识别的完整流程。

发明内容

发明目的:本发明的目的是为了克服现有技术在城市河道水上对象分类识别方面的不足,提供一种基于深度学习的高精度的城市河道水上多对象检测识别方法与系统,为智慧水利和河长制提供先进技术。

技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于DCBFFNet的城市河道水上多目标检测方法,包含以下步骤:

(1)从视频流中分别提取城市河道管理涉及水上对象的图像,包括瓶子类图像、水草类图像、混合物类图像、船只类图像,使用限制对比度自适应直方图均衡化方法对采取的图像进行降噪处理,再利用矩形框对各类水上对象进行位置和类别标签的语义标注,构建目标检测数据集;

(2)构建一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,包括:

构建面向多对象特性的特征层选择模块,分别研究数据集中每一类检测对象的尺度参数与不同卷积层的感受野尺度参数及对应尺度下提取特征的差异性,有针对性地选取模型中需要融合的不同尺度、不同分辨率的特征图;

构建基于多尺度特征的密集双向特征融合模块,根据选择的不同尺度和不同分辨率的特征图设计两种不同结构的传输连接块TCM和TCB,多个相互连接的传输连接块TCM和多个相互连接的传输连接块TCB分别构建自上而下和自下而上的两个互逆传输路径,以选取的多层特征图为输入,基于密集连接的方式分别完成自上而下和自下而上的特征传输及特征融合;

设计面向多对象的多层特征图锚框尺寸,利用原始图与不同特征图的采样映射关系,采用聚类算法分别统计不同特征图上映射的各类水上对象矩形标注框的尺度分类,确定选取的各层特征图上的锚框尺寸,其中聚类算法中的距离使用d=1-IoU(bboxes,anchor)表示;

构建基于多尺度特征的目标检测模块,以密集双向特征融合模块的输出为输入,对多尺度、多类别目标进行类别预测和回归;

(3)基于最优的锚框尺寸和构建的目标检测数据集,对DCBFFNet模型进行迭代训练;

(4)基于训练好的模型实现水上各类对象的定位和类别预测,并将检测结果可视化。

进一步地,所述步骤(2)中特征图选取步骤包括:

(a)遍历整个检测数据集中包括瓶子类、水草类、船只类、混合物类的各类水上对象的标记框尺度,分别以点状分布图的形式直观体现;

(b)计算不同特征层的感受野大小,并与(a)中获取的对象尺度进行比较,选取感受野与对象尺度相匹配的特征层,感受野公式如下:

其中,l

(c)可视化(b)中获取的多个特征层,比较不同卷积层获取的特征的差异性,并从中选取分别包含对象细节信息和高级语义信息的五层特征层。

作为优选,仅使用四层特征图作为检测特征图,将选取的特征图中尺度最大、分辨率最高的一层仅用于提供目标特征,不在该层进行分类回归。

作为优选,所述步骤(2)中多个相互连接的传输连接块TCM和多个相互连接的传输连接块TCB间的密集连接采用的是选择连接的方式,将包含低/高层特征的TCM/TCB逐次与包含高/低层语义特征的TCM/TCB连接,实现特征跨层交互;不同层间特征融合的过程表示为:

X

其中,X

作为优选,特征层选择模块由七组顺序连接的卷积结构和分类层、回归层组成,卷积结构用于特征提取,分类层和回归层实现“背景-目标”的二分类和回归;经特征差异性分析后,选取第四至第七卷积结构输出的逐层递减的四层特征图C3、C4、C5、C6作为检测特征图;在密集双向特征融合模块,采用依次连接的第一、第二、第三传输连接块TCM自上而下融合C6、C5、C4、C3以及特征层选择模块中第三卷积结构输出的特征图;其中第一传输连接块TCM以C6、C5卷积运算后的特征图为输入,融合后输出至第二传输连接块TCM,第二传输连接块TCM以C4卷积运算后的特征图以及第一传输连接块TCM输出为输入,融合后输出至第三传输连接块TCM,第三传输连接块TCM以C3、C2卷积运算后的特征图以及第二传输连接块TCM输出为输入,融合后得到的特征图作为目标检测模块中第一尺度特征图;第一传输连接块TCB以第三传输连接块TCM输出以及第二传输连接块TCM输出作为输入,融合后得到的特征图作为目标检测模块中第二尺度特征图,且另一路输出至第二传输连接块TCB,第二传输连接块TCB以第一传输连接块TCB输出以及三个传输连接块TCM输出逐元素融合特征作为输入,融合后得到的特征图作为目标检测模块中第三尺度特征图,且另一路输出至第三传输连接块TCB,第三传输连接块TCB一路输入为第二传输连接块TCB输出,另一路输入以三个传输连接块TCM输出以及C6卷积运算输出逐元素融合特征作为输入,融合后得到的特征图作为目标检测模块中第四尺度特征图;目标检测模块基于第一尺度至第四尺度特征图进行多类别对象的检测识别和回归。

作为优选,所述步骤(2)中采用优化的K-means聚类算法分别统计不同特征图上映射的四类水上对象矩形标注框的尺度分类,确定选取的各层特征图上的锚框尺寸,具体过程如下:在各层特征图下,预选取不同K值,并根据最大可能召回率参数,比较不同K值下的聚类效果,选取该层最优K值,基于各层获取的最优K值下的聚类效果,在不同特征图中设计不同数量和宽高比的锚框;基于最优K值获取的锚框宽高比a

其中,

m表示特征图的个数;S

一种基于DCBFFNet的城市河道水上多目标检测系统,包括:

目标检测数据集构建模块,用于从视频流中分别提取城市河道管理涉及水上对象的图像,包括瓶子类图像、水草类图像、混合物类图像、船只类图像,对采取的图像进行降噪处理,再利用矩形框对各类水上对象进行位置和类别标签的语义标注,构建目标检测数据集;

深度学习模型,为一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,其构建过程包括:构建面向多对象特性的特征层选择模块,分别研究数据集中每一类检测对象的尺度参数与不同卷积层的感受野尺度参数及对应尺度下提取特征的差异性,有针对性地选取模型中需要融合的不同尺度、不同分辨率的特征图;构建基于多尺度特征的密集双向特征融合模块,根据选择的不同尺度和不同分辨率的特征图设计两种不同结构的传输连接块TCM和TCB,多个相互连接的传输连接块TCM和多个相互连接的传输连接块TCB分别构建自上而下和自下而上的两个互逆传输路径,以选取的多层特征图为输入,基于密集连接的方式分别完成自上而下和自下而上的特征传输及特征融合;设计面向多对象的多层特征图锚框尺寸,利用原始图与不同特征图的采样映射关系,采用聚类算法分别统计不同特征图上映射的各类水上对象矩形标注框的尺度分类,确定选取的各层特征图上的锚框尺寸,其中聚类算法中的距离使用d=1-IoU(bboxes,anchor)表示;构建基于多尺度特征的目标检测模块,以密集双向特征融合模块的输出为输入,对多尺度、多类别目标进行类别预测和回归;

模型训练模块,用于基于最优的锚框尺寸和构建的目标检测数据集,对DCBFFNet模型进行迭代训练;

以及水上多目标检测模块,用于基于训练好的模型实现水上各类对象的定位和类别预测,并将检测结果可视化。

作为优选,DCBFFNet模型中,特征层选择模块由七组顺序连接的卷积结构和分类层、回归层组成,卷积结构用于特征提取,分类层和回归层实现“背景-目标”的二分类和回归;经特征差异性分析后,选取第四至第七卷积结构输出的逐层递减的四层特征图C3、C4、C5、C6作为检测特征图;在密集双向特征融合模块,采用依次连接的第一、第二、第三传输连接块TCM自上而下融合C6、C5、C4、C3以及特征层选择模块中第三卷积结构输出的特征图;其中第一传输连接块TCM以C6、C5卷积运算后的特征图为输入,融合后输出至第二传输连接块TCM,第二传输连接块TCM以C4卷积运算后的特征图以及第一传输连接块TCM输出为输入,融合后输出至第三传输连接块TCM,第三传输连接块TCM以C3、C2卷积运算后的特征图以及第二传输连接块TCM输出为输入,融合后得到的特征图作为目标检测模块中第一尺度特征图;第一传输连接块TCB以第三传输连接块TCM输出以及第二传输连接块TCM输出作为输入,融合后得到的特征图作为目标检测模块中第二尺度特征图,且另一路输出至第二传输连接块TCB,第二传输连接块TCB以第一传输连接块TCB输出以及三个传输连接块TCM输出逐元素融合特征作为输入,融合后得到的特征图作为目标检测模块中第三尺度特征图,且另一路输出至第三传输连接块TCB,第三传输连接块TCB一路输入为第二传输连接块TCB输出,另一路输入以三个传输连接块TCM输出以及C6卷积运算输出逐元素融合特征作为输入,融合后得到的特征图作为目标检测模块中第四尺度特征图;目标检测模块基于第一尺度至第四尺度特征图进行多类别对象的检测识别和回归。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于DCBFFNet的城市河道水上多目标检测方法。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于DCBFFNet的城市河道水上多目标检测方法。

有益效果:与现有技术相比,本发明的技术方案具有以下有益的技术效果:

1)在基于锚框的目标检测与识别模型中,锚框的选取影响着最终效果。不同于以往根据原始图像中目标的尺度在多层特征图上设置相同宽高比锚框的设计方法,本发明根据瓶子类、水草类、船只类、混合物类四类水上对象的特征不同特征图上的分布情况,确定不同尺度特征图上的锚框的数量和宽高比,从而提升每一层特征图对目标检测的有效性,缩短训练时间,提升检测及精度。

2)本发明中构建了一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,结合四类水上对象的尺度特征与不同卷积层的感受野大小和提取特征的差异性,从模型中选取多层不同尺度、不同分辨率的特征图,并构建了两种不同结构的传输连接块,以多层不同尺度的特征图为输入,基于密集连接的方式进行特征传输和特征双向融合,提升不同对象类特征层的充分融合,水上对象分类识别性能。

附图说明

图1是本发明提供的一种基于对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet的城市河道水上多目标检测方法的流程示意图;

图2是本发明中构建检测数据集的流程示意图;

图3是本发明构建的DCBFFNet模型的网络结构图;

图4是本发明中传输连接块TCM的网络结构图;

图5是本发明中传输连接块TCB的网络结构图;

图6是本发明中不同卷积层输出特征图的可视化效果图(以Conv4_3层和Conv5_3层为例);

图7是本发明中基于DCBFFNet的城市河道水上多目标检测方法实验图;

图8是本发明中的DCBFFNet算法与其他经典算法的P-R(Precision-Recall)曲线对比图。

具体实施方式

下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明所述的一种基于深度学习模型DCBFFNet的城市河道水上多目标检测方法,见图1,该图中给出了本发明实施例的算法流程,图3是本发明中DCBFFNet模型的网络结构图,方法流程具体包括以下步骤:

步骤一:采集图像并构建多目标检测数据集

从视频流中分别提取城市河道管理涉及水上对象的图像,对采取的图像进行降噪处理和标注,构建目标检测数据集。本实施例中为保持水上对象的多样性,使用OpenCV库的VideoCaputer方法对不同时间、不同天气和不同场景的河道监控视频进行图像数据截取,截取时间间隔t由视频监控区域内水流速度决定。本实例中t=3,即每隔3秒从视频图像中截取一幅图像。除此之外,从构建训练数据集所含样本量需求和样本平衡需求的角度考虑,结合城市河道管理涉及的水上对象,根据不同对象所在图像中的空间位置和形态特征从截取到的图像中选择出560张瓶子类图像、2000张水草类图像、2168张船只类图像、2550张混合物图像。并利用矩形框对四类对象进行位置和语义标注,构建包含四类对象的目标检测数据集。

除此之外,基于四类对象图像中存在的一些问题(如光照不均匀等)使用限制对比度自适应直方图均衡化方法对图像进行增强。限制对比度自适应直方图均衡化算法将图像划分为多个子区域,对每个子区域分别进行直方图均衡化,通过限制局部直方图的高度来抑制噪声放大和局部对比度增强,具体过程如下:

1)以M*M大小滑动窗口的方式划分子区域,得到其局部映射函数m(i):

和局部映射函数m(i)的斜率S:

其中,C

2)通过设定阈值T对直方图进行截断划分,截断部分将均匀分布整个灰度阶段,能够在总面积不变的情况下提升直方图高度,提升的高度表示为L,则最后的直方图可表示为:

其中,

S

步骤二:构建一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet

本发明基于获取的四类水上对象的尺度特征和不同卷积层提取特征的差异性,构建了一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,该模型主要包含三个创新模块:特征层选择模块,密集双向特征融合模块和目标检测模块。其中特征层选择模块由7组顺序连接的卷积结构和分类层、回归层组成,卷积结构用于特征提取,分类层和回归层实现目标的二分类和回归。同时该模块提供了模型需要的多尺度特征图,实现多尺度对象的检测。密集双向特征融合模块构建了两种不同结构的传输连接块,实现多尺度特征的传输和双向融合,同时连接了特征层选择模块和目标检测模块,使模型实现两步级联回归,特征层选择模块进行“背景-目标”的二分类和回归,目标检测模块在二分类结果的基础上进行多类别对象的检测识别和回归。

其中,在特征层选择模块中选取需要融合的不同尺度、不同分辨率的特征图时,采用面向对象特性的特征层选择方法。该方法分别研究了数据集中每一类检测对象的尺度参数与不同卷积层的感受野尺度参数及对应尺度下提取特征的差异性;再根据特征选择的有效性和多样性的角度,有针对性地选取模型中需要融合的不同尺度、不同分辨率的特征图。具体的特征图选取步骤主要包括:

(a)遍历整个检测数据集中瓶子类、水草类、船只类、混合物类四类水上对象的标记框尺度,分别以点状分布图的形式直观体现;

(b)计算不同特征层的感受野大小,并与(a)中获取的对象尺度进行比较,选取感受野与对象尺度相匹配的特征层,感受野公式如下:

其中,l

(c)可视化(b)中获取的多个特征层(示意图如图6所示),比较不同卷积层获取的特征的差异性,并从中选取分别包含对象细节信息和高级语义信息的五层特征层,记为{C2,C3,C4,C5,C6};但为减少推理时间,仅使用四层特征图作为检测特征图,将选取的特征图中尺度最大、分辨率最高的一层C2仅用于提供目标特征,不在该层进行分类回归。

本实例选取的特征图分别为conv3_3,conv4_3,conv5_3,fc7,conv6_2五层卷积层输出的特征图,且特征图的尺度以2x逐层递减,将其分别记为{C2,C3,C4,C5,C6}。

除此之外,本实例基于上述方法获取的多层特征层,设计了多个相互连接的传输连接块TCM和TCB,构成基于多尺度特征的密集双向融合模块,实现了多尺度特征传输及特征双向融合。根据选择的不同尺度和不同分辨率的特征图分别构建两种不同结构的传输连接块TCM和TCB,多个相互连接的传输连接块TCM和多个相互连接的传输连接模块TCB分别形成一条自上而下和一条自下而上路径,模型通过这两种互逆路径进行特征双向融合。同时,TCM与TCB间以密集连接方式进行特征传输,密集连接的方式为选择连接,将TCM输出的低层特征图逐层传输给TCB的高层特征并进行融合,实现特征跨层交互。不同层间直接进行特征融合,减少了由卷积层数加深造成的信息损失。特征融合的结果可由下式得到:

其中,X

在密集双向特征融合模块中,由于选取的特征图{C2,C3,C4,C5,C6}间通道数各不相同,因此在进行传输和融合前需通过3*3的卷积进行通道数降维,使其保持相同的通道数(channel=256),输出特征图{P2,P3,P4,P5,P6}。

除此之外,密集双向特征融合模块通过三个依次连接的传输连接块TCM,形成一个自上而下的传输路径,其中第一传输连接块TCM分别以特征图P5、P6为两路输入,通过3*3卷积增强后,其中一路使用2*2的反卷积对尺度较小的特征图P6进行两倍上采样,使其达到P5相同尺度,然后对两路输入的特征图进行逐元素融合,融合后的特征一方面输出给第二传输连接块TCM,另一方面经3*3卷积消除重叠效应后传递给第二传输连接块TCB;第二传输连接块TCM与第一传输连接块TCM具有相同的结构,通过相同的方式将特征图P4与第一传输连接块TCM输出的特征图进行融合,并融合后的特征图分别传入第三传输连接块TCM和第一传输连接块TCB;第三传输连接块TCM分别以特征图P2、P3及第二传输连接块TCM的输出为三路输入,其中一路使用3*3卷积将特征图P2下采样到P3尺度,另一路通过2*2反卷积将第二传输连接块TCM输出的特征图上采样到P3尺度大小,最后将三路特征图进行逐元素融合,并利用3*3卷积消除重叠效应后,一方面作为输入传入第一传输连接块TCB,另一方面作为目标检测模块中第一尺度特征图K3。另外,三个依次连接的传输连接块TCB,形成一个自下而上的传输路径,且各TCM与TCB间选择连接,即各传输连接块TCM逐层与较之自己高层的传输连接块TCB进行连接和融合,具体的连接与融合方式为:第一传输连接块TCB分别以第三传输连接块TCM输出以及第二传输连接块TCM输出为两路输入,其中一路利用3*3卷积将第三传输连接块TCM输出下采样到第一传输连接块TCB尺度后,与另一路输入进行逐元素融合,融合后得到的特征图一方面传入第二传输连接块TCB,另一方面作为目标检测模块中第二尺度特征图K4;第二传输连接块TCB与第一传输连接块TCB具有相同结构,不同在于第二传输连接块TCB的一路输入是第一传输连接块TCB的输出,另一路输入是第二、第三传输连接块TCM输出融合后的特征,即第二传输连接块TCB融合了第一传输连接块TCB和第二、第三传输连接块TCM输出,融合后的特征图一方面传输给第三传输连接块TCB,另一方面作为目标检测模块中第三尺度特征图K5;第三传输连接块TCB一路输入为第二传输连接块TCB输出,另一路输入为第二、第三传输连接块TCM输出以及C6卷积运算输出逐元素融合特征作为输入,融合后得到的特征图作为目标检测模块中第四尺度特征图K6。

此外,DCBFFNet模型以锚框为基础进行分类回归,锚框设计是否匹配获取的四类水上对象尺度,影响着模型最终的检测效果。因此本实例构建一种面向对象的多层特征图锚框尺寸设计模块,用以设计出与四类水上对象尺度相匹配的锚框。这与单一类别目标检测难度完全不同,因为不同目标锚框尺寸设计之间可能存在矛盾,所以均衡不同目标锚框尺寸和数量是关键。该方法利用原始图与不同特征图的采样映射关系,采用优化的K-means聚类算法分别统计不同特征图上映射的四类水上对象矩形标注框的尺度分类,确定选取的各层特征图上的锚框尺寸,其中使用d=1-IoU(bboxes,anchor)表示距离,代替K-means算法中的欧式距离,这里的IoU(bboxes,anchor)表示目标标注框bboxes与锚框anchor的交并比。具体过程如下:在各层特征图下,预选取不同K值(K∈[3,9]),并最大可能召回率参数,比较不同K值下的聚类效果,选取该层最优K值,基于各层获取的最优K值,可在不同特征图中获得不同数量和宽高比的锚框。基于最优K值获取的锚框宽高比a

其中,

m表示特征图的个数,本发明中取m=4;S

本实例中根据此方法,得到各特征层的最优K值,分别为{5,3,3,3},C3,C4,C5,C6层上设置锚框的宽高比分别为{2:5,2:3,1,3:2,5:2},{1:2,1:1,2:1},{2:3,1:1,3:2},{1:3,1:1,3:1},即这四层特征图上每个位置单元设置锚框数分别为{5,3,3,3},锚框尺度分别设置为{24

步骤三:训练DCBFFNet模型

该步骤进行DCBFFNet模型的训练,训练模式以在不同尺度特征图上密集采样的锚框为训练样本,根据步骤三得到的锚框数量和宽高比等参数,在步骤二中获取的不同尺度特征图上密集采样不同数量和宽高比的锚框。以0.0001为初始学习率并采用固定步长衰减学习率的方式进行DCBFFNet模型的迭代训练。DCBFFNet模型以聚焦损失函数Focal Loss为分类损失函数,Smooth_L1为回归损失函数,通过迭代训练的方式优化模型参数。

总损失函数包含特征层选择模块的分类、回归损失函数和目标检测模块的分类、回归损失函数,可表示为:

其中,i表示一个mini-batch中的第i个锚框;N

步骤四:测试DCBFFNet模型

基于训练好的模型实现水上四类对象的定位和类别预测,利用预测框和类别标签完成检测结果的可视化。由于密集双向特征融合模块连接了特征层选择模块和目标检测模块,实现两步级联回归,在预测推理阶段,需进行两次分类预测,即“背景-目标”的二分类和多种类对象的多分类。

基于相同的发明构思,本发明实施例公开的一种基于DCBFFNet的城市河道水上多目标检测系统,包括:目标检测数据集构建模块,用于从视频流中分别提取城市河道管理涉及水上对象的图像,包括瓶子类图像、水草类图像、混合物类图像、船只类图像,对采取的图像进行降噪处理,再利用矩形框对各类水上对象进行位置和类别标签的语义标注,构建目标检测数据集;深度学习模型,为一种对象尺度敏感的密集连接双向特征融合深度学习模型DCBFFNet,其构建过程包括:构建面向多对象特性的特征层选择模块,分别研究数据集中每一类检测对象的尺度参数与不同卷积层的感受野尺度参数及对应尺度下提取特征的差异性,有针对性地选取模型中需要融合的不同尺度、不同分辨率的特征图;构建基于多尺度特征的密集双向特征融合模块,根据选择的不同尺度和不同分辨率的特征图设计两种不同结构的传输连接块TCM和TCB,多个相互连接的传输连接块TCM和多个相互连接的传输连接块TCB分别构建自上而下和自下而上的两个互逆传输路径,以选取的多层特征图为输入,基于密集连接的方式分别完成自上而下和自下而上的特征传输及特征融合;设计面向多对象的多层特征图锚框尺寸,利用原始图与不同特征图的采样映射关系,采用聚类算法分别统计不同特征图上映射的各类水上对象矩形标注框的尺度分类,确定选取的各层特征图上的锚框尺寸,其中聚类算法中的距离使用d=1-IoU(bboxes,anchor)表示;构建基于多尺度特征的目标检测模块,以密集双向特征融合模块的输出为输入,对多尺度、多类别目标进行类别预测和回归;模型训练模块,用于基于最优的锚框尺寸和构建的目标检测数据集,对DCBFFNet模型进行迭代训练;以及水上多目标检测模块,用于基于训练好的模型实现水上各类对象的定位和类别预测,并将检测结果可视化。上述系统各模块的具体实施参见前述方法实施例,不再赘述。

基于相同的发明构思,本发明实施例公开的一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于DCBFFNet的城市河道水上多目标检测方法。

基于相同的发明构思,本发明实施例公开的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于DCBFFNet的城市河道水上多目标检测方法。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号