首页> 中国专利> 基于动态特征基于标签的迁移特征的神经网络的训练方法

基于动态特征基于标签的迁移特征的神经网络的训练方法

摘要

本申请涉及智慧建筑领域下的智能施工安全监测,其具体地公开了一种基于动态特征基于标签的迁移特征的神经网络的训练方法,其在训练过程中,在以分类损失函数值训练神经网络的基础上,分别计算标签值与用于表征待检测对象的静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合被检测对象的动态特征信息和静态特征信息。

著录项

  • 公开/公告号CN112800912A

    专利类型发明专利

  • 公开/公告日2021-05-14

    原文格式PDF

  • 申请/专利权人 江苏天幕无人机科技有限公司;

    申请/专利号CN202110074093.2

  • 发明设计人 张旭;

    申请日2021-01-20

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);

  • 代理机构

  • 代理人

  • 地址 210043 江苏省南京市江北新区人力资源服务产业园一期17栋101-6室

  • 入库时间 2023-06-19 10:58:46

说明书

技术领域

本发明涉及智能制造领域下的智能操作状态控制,且更为具体地,涉及一种基于动态特征基于标签的迁移特征的神经网络的训练方法、基于深度神经网络的稳定性检测方法、基于动态特征基于标签的迁移特征的神经网络的训练系统、基于深度神经网络的稳定性检测系统和电子设备。

背景技术

装配式建筑是指把传统建造方式中的大量现场作业工作转移到工厂进行,在工厂加工制作好建筑用构件和配件(如楼板、墙板、楼梯、阳台等),运输到建筑施工现场,通过可靠的连接方式在现场装配安装而成的建筑。装配式建筑的构件大多是板状(墙板等)构件,在工厂或现场施工时,都需要通过吊运设备转运至安装位置。

由于板状构件在吊运时容易发生晃动,目前,为了评估板状构件在吊运时的晃动,一些吊运设备加装了扭转传感器,用于感应吊运板状构件的线缆的扭转值,从而确定板状构件的晃动是否超出了必要幅度,以提高转运时的安全性。但是,仅通过扭转值的晃动检测仍然存在准确性不够的问题。

因此,期待一种优化的用于被吊运板状构件的稳定性检测的技术方案。

目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为被吊运板状构件的稳定性检测提供了新的解决思路和方案。

发明内容

为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于动态特征基于标签的迁移特征的神经网络的训练方法、基于深度神经网络的稳定性检测方法、基于动态特征基于标签的迁移特征的神经网络的训练系统、基于深度神经网络的稳定性检测系统和电子设备,其在训练过程中,在以分类损失函数值训练神经网络的基础上,分别计算标签值与用于表征待检测对象的静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合被检测对象的动态特征信息和静态特征信息。

根据本申请的一个方面,提供了一种基于动态特征基于标签的迁移特征的神经网络的训练方法,其包括:

步骤1:获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧;

步骤2:获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值;

步骤3:分别将所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图;

步骤4:将所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图;

步骤5:分别计算所述标签值与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值;

步骤6:融合所述第一特征图和所述第二特征图以获得分类特征图;

步骤7:将所述分类特征图通过分类器以获得分类损失函数值;

步骤8:基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

在上述基于动态特征基于标签的迁移特征的神经网络的训练方法中,步骤6:融合所述第一特征图和所述第二特征图以获得分类特征图,包括:计算所述第一特征图和所述第二特征图的按像素位置的加权和,以获得所述分类特征图。

在上述基于动态特征基于标签的迁移特征的神经网络的训练方法中,步骤7:将所述分类特征图通过分类器以获得分类损失函数值,包括:将所述分类特征图通过一个或多个全连接层,以获得分类特征向量;将所述分类特征向量输入Softmax分类函数,以获得分类结果;以及,将所述分类结果和真实值输入损失函数,以获得所述分类损失函数值。

在上述基于动态特征基于标签的迁移特征的神经网络的训练方法中,所述当前帧与所述先前帧之间具有预设时间间隔。

在上述基于动态特征基于标签的迁移特征的神经网络的训练方法中,所述深度卷积神经网络为深度残差网络。

根据本申请的另一方面,提供了一种基于深度神经网络的稳定性检测方法,其包括:

获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;以及

将所述待检测图像输入根据如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法所训练的深度卷积神经网络和分类器,以获得分类结果,所述分类结果用于表示被吊运的板状构件的稳定性是否符合预设要求。

根据本申请的又一方面,提供了一种基于动态特征基于标签的迁移特征的神经网络的训练系统,其包括:

监控视频获取单元,用于执行步骤1:获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧;

标签值获取单元,用于执行步骤2:获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值;

静态特征图生成单元,用于执行步骤3:分别将所述监控视频获取单元获得的所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图;

动态特征图生成单元,用于执行步骤4:将所述静态特征图生成单元获得的所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图;

融合交叉熵损失函数值计算单元,用于执行步骤5:分别计算所述标签值获取单元获得的所述标签值与所述静态特征图生成单元获得的所述第一特征图的第一交叉熵函数值以及所述标签值获取单元获得的所述标签值与所述动态特征图生成单元获得的所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值;

分类特征图生成单元,用于执行步骤6:融合所述静态特征图生成单元获得的所述第一特征图和所述第二特征图以获得分类特征图;

分类损失函数值计算单元,用于执行步骤7:将所述分类特征图生成单元获得的所述分类特征图通过分类器以获得分类损失函数值;

参数更新单元,用于执行步骤8:基于所述融合交叉熵损失函数值计算单元获得的所述融合交叉熵损失函数值和所述分类损失函数值计算单元获得的所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

在上述基于动态特征基于标签的迁移特征的神经网络的训练系统中,所述分类特征图生成单元,进一步用于计算所述第一特征图和所述第二特征图的按像素位置的加权和,以获得所述分类特征图。

在上述基于动态特征基于标签的迁移特征的神经网络的训练系统中,所述分类损失函数值计算单元,包括:编码子单元,用于将所述分类特征图通过一个或多个全连接层,以获得分类特征向量;分类结果获取子单元,用于将所述分类特征向量输入Softmax分类函数,以获得分类结果;以及,损失函数值计算子单元,用于将所述分类结果和真实值输入损失函数,以获得所述分类损失函数值。

在上述基于动态特征基于标签的迁移特征的神经网络的训练系统中,所述当前帧与所述先前帧之间具有预设时间间隔。

在上述基于动态特征基于标签的迁移特征的神经网络的训练系统中,所述深度卷积神经网络为深度残差网络。

根据本申请的再一方面,提供了一种基于深度神经网络的稳定性检测系统,其包括:

待检测图像获取单元,用于获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;以及

分类结果生成单元,用于将所述待检测图像获取单元获得的所述待检测图像输入根据如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法所训练的深度卷积神经网络和分类器,以获得分类结果,所述分类结果用于表示被吊运的板状构件的稳定性是否符合预设要求。

根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法,或者,基于深度神经网络的稳定性检测方法。

根据本申请的再又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法,或者,基于深度神经网络的稳定性检测方法。

与现有技术相比,本申请提供的一种基于动态特征基于标签的迁移特征的神经网络的训练方法、基于深度神经网络的稳定性检测方法、基于动态特征基于标签的迁移特征的神经网络的训练系统、基于深度神经网络的稳定性检测系统和电子设备,其在训练过程中,在以分类损失函数值训练神经网络的基础上,分别计算标签值与用于表征待检测对象的静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合被检测对象的动态特征信息和静态特征信息。

附图说明

通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法和基于深度神经网络的稳定性检测方法的应用场景图;

图2图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法的流程图;

图3图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法的系统架构示意图;

图4图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法中,步骤7:将所述分类特征图通过分类器以获得分类损失函数值的流程图;

图5图示了根据本申请实施例的基于深度神经网络的稳定性检测方法的流程图;

图6图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练系统的框图。

图7图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练系统中分类损失函数值计算单元的框图。

图8图示了根据本申请实施例的基于深度神经网络的稳定性检测系统的框图。

图9图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。

如前所述,装配式建筑是指把传统建造方式中的大量现场作业工作转移到工厂进行,在工厂加工制作好建筑用构件和配件(如楼板、墙板、楼梯、阳台等),运输到建筑施工现场,通过可靠的连接方式在现场装配安装而成的建筑。装配式建筑的构件大多是板状(墙板等)构件,在工厂或现场施工时,都需要通过吊运设备转运至安装位置。

由于板状构件在吊运时容易发生晃动,目前,为了评估板状构件在吊运时的晃动,一些吊运设备加装了扭转传感器,用于感应吊运板状构件的线缆的扭转值,从而确定板状构件的晃动是否超出了必要幅度,以提高转运时的安全性。但是,仅通过扭转值的晃动检测仍然存在准确性不够的问题。

因此,期待一种优化的用于被吊运板状构件的稳定性检测的技术方案。

因为板状构件的晃动直接表现为视觉特征,因此本申请的申请人期望通过基于深度学习的计算机视觉技术,来通过从板状构件的晃动图像中提取图像特征并进行分类,来进行晃动检测。

在实践过程当中,本申请的申请人发现一方面,表示晃动的视频中的连续帧(不一定是相邻帧,也可以间隔数帧)之间的图像关联包含比较丰富的用于判定晃动的信息,另一方面,现有的扭转传感器的扭转值也包含了比较丰富的用于判定晃动的信息,如果能够有效地融合各方面的信息,则一方面可以提高训练的性能,包括训练速度,模型训练的鲁棒性,一方面也可以提高训练后的模型的准确性。

因此,在本申请的技术方案中,本申请的申请人在交叉熵损失函数的基础上,分别计算标签值与静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合上述信息。

具体的,首先获取吊运设备吊运板状构件时的视频,并提取当前帧和先前帧,以及当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值。然后,分别将当前帧和先前帧通过卷积神经网络获得第一特征图和第二特征图,并将第一特征图乘以第二特征图以获得第三特征图。接着,分别计算所述标签值与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值,并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值。

并且,将所述第一特征图和所述第二特征图通过加权融合以获得分类特征图,并通过分类器获得分类损失函数值,从而基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和训练所述卷积神经网络。

基于此,本申请提出了一种基于动态特征基于标签的迁移特征的神经网络的训练方法,其包括:步骤1:获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧;步骤2:获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值;步骤3:分别将所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图;步骤4:将所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图;步骤5:分别计算所述标签值与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值;步骤6:融合所述第一特征图和所述第二特征图以获得分类特征图;步骤7:将所述分类特征图通过分类器以获得分类损失函数值;以及,步骤8:基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

基于此,本申请还提出了一种基于深度神经网络的稳定性检测方法,其包括:获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;以及,将所述待检测图像输入根据如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法所训练的深度卷积神经网络和分类器,以获得分类结果,所述分类结果用于表示被吊运的板状构件的稳定性是否符合预设要求。

图1图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法和基于深度神经网络的稳定性检测方法的应用场景图。

如图1所示,在该应用场景的训练阶段中,通过摄像头(例如,如图1中所示意的C)吊运设备吊运板状构件时的监控视频以及通过扭转传感器(例如,如图1中所示意的D)感应吊运板状构件的线缆的扭转值作为标签值;然后,将所述监控视频输入至部署有基于动态特征基于标签的迁移特征的神经网络的训练算法的服务器中(例如,如图1中所示意的S),其中,所述服务器能够基于动态特征基于标签的迁移特征的神经网络的训练算法以所述监控视频中的图像帧对用于被吊运板状构件的稳定性检测的神经网络进行训练。

在通过如上所述的基于动态特征基于标签的迁移特征的神经网络的训练算法训练好所述神经网络后,可基于所述深度神经网络对被吊运板状构件的稳定性进行检测。

进一步地,如图1所示,在该应用场景的应用阶段,通过摄像头(例如,如图1中所示意的C)获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;然后,将所述待检测图像输入至部署有基于深度神经网络的稳定性检测算法的服务器中(例如,如图1中所示意的S),其中,所述服务器能够基于深度神经网络的稳定性检测算法对所述待检测图像进行处理,以生成用于表示被吊运的板状构件的稳定性是否符合预设要求的检测结果。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

图2图示了基于动态特征基于标签的迁移特征的神经网络的训练方法的流程图。如图2所示,根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法,包括:步骤1:获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧;步骤2:获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值;步骤3:分别将所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图;步骤4:将所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图;步骤5:分别计算所述标签值与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值;步骤6:融合所述第一特征图和所述第二特征图以获得分类特征图;步骤7:将所述分类特征图通过分类器以获得分类损失函数值;以及,步骤8:基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

图3图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法的架构示意图。如图3所示,在所述基于动态特征基于标签的迁移特征的神经网络的训练方法的网络架构中,首先,将从吊运设备吊运板状构件时的监控视频中提取出的当前帧(例如,如图3中所示意的IN0)和先前帧(例如,如图3中所示意的IN1)通过深度卷积神经网络(例如,如图3中所示意的CNN),以获得对应于所述当前帧的第一特征图(例如,如图3中所示意的F1)和对应于所述先前帧的第二特征图(例如,如图3中所示意的F2);接着,将所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图(例如,如图3中所示意的F3);然后,分别计算标签值(例如,如图3中所示意的P)与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值,其中,所述标签值为述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值;进而,融合所述第一特征图和所述第二特征图以获得分类特征图(例如,如图3中所示意的Fc);然后,将所述分类特征图通过分类器以获得分类损失函数值;最终,基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

在步骤1中,获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧。如前所述,在本申请的技术方案中,板状构件的晃动直接表现为视觉特征,因此本申请的申请人期望通过基于深度学习的计算机视觉技术,来通过从板状构件的晃动图像中提取图像特征并进行分类,来进行晃动检测。

在实践过程当中,本申请的申请人发现一方面,表示晃动的视频中的连续帧(不一定是相邻帧,也可以间隔数帧)之间的图像关联包含比较丰富的用于判定晃动的信息,另一方面,现有的扭转传感器的扭转值也包含了比较丰富的用于判定晃动的信息,如果能够有效地融合各方面的信息,则一方面可以提高训练的性能,包括训练速度,模型训练的鲁棒性,一方面也可以提高训练后的模型的准确性。

因此,在申请的技术方案中,获取吊运设备吊运板状构件时的监控视频作为训练数据,并从所述监控视频中提取当前帧和先前帧,其中,所述当前帧与所述先前帧之间的图像关联包含比较丰富的用于判定晃动的信息。

值得一提的是,在本申请实施例中,所述当前帧与所述先前帧之间具有预设时间间隔。例如,本申请一个具体的示例中,所述当前帧与所述先前帧为相邻帧,或者,两者之间间隔预设数量的图像帧。

在步骤2中,获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值。应可以理解,扭转值包含了比较丰富的用于判定晃动的信息。

在步骤3中,分别将所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图。也就是,以深度卷积神经网络对所述当前帧和所述先前帧进行处理,以提取出所述当前帧与所述先前帧中的高维隐含特征。

在本申请实施例中,所述深度卷积神经网络可采用深度残差神经网络,例如,ResNet 50。本领域普通技术人员应知晓,相较于传统的卷积神经网络,深度残差网络为在传统卷积神经网络的基础上提出的一种优化网络结构,其主要解决在训练过程中的梯度消失的问题。深度残差网络引入了残差网络结构,通过残差网络结构可以把网络层弄得更深,并且,不会发生梯度消失的问题。残差网络借鉴了高速网络的跨层链接思想,其打破了传统的神经网络从N-1层的输入层只能给N层作为输入的惯例,使某一层的输出可以直接跨过几层作为后面某一层的输入,其意义在于为迭加多层网络而使得整个学习模型的错误率不降反升的难题提供了新的方向。

在步骤4中,将所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图。更明确地,将所述第一特征图与所述第二特征图进行矩阵相乘,以将所述第二特征图中的信息作用于所述第一特征图中,以获得所述第三特征图。应可以理解,所述第二特征图对应于所述先前帧,因此,将将所述第一特征图与所述第二特征图进行矩阵相乘,意味着将所述先前帧中的信息作用于所述当前帧中,以使得所获得的所述第三特征图中包含当前帧与先前帧之间的图像关联。

在步骤5中,分别计算所述标签值与所述第一特征图的第一交叉熵函数值以及所述标签值与所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值。这里,所述第一交叉熵损失函数值表示所述第一特征图中的特征分布符合所述标签值的概率,所述第二交叉熵损失函数值表示所述第三特征图中的特征分布符合所述标签值的概率。

应可以理解,所述第一特征图对应于所述当前帧,所述第三特征图通过所述第二特征图与所述第一特征图的矩阵相乘获得,因此,所述第一特征图表示被吊运板状构件的静态特征,所述第三特征图表示被吊运板状构件的动态特征。也就是,在本申请的技术方案中,在交叉熵损失函数的基础上,所述训练方法分别计算标签值与静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合上述信息。

在步骤6中,融合所述第一特征图和所述第二特征图以获得分类特征图。也就是,将所述第一特征图和所述第二特征图通过加权融合以获得分类特征图。这里,所述第一特征图和所述第二特征图表示所述被吊运的板状构件在不同时刻的静态特征,因此,所述分类特征图也表示静态特征。

在本申请一个具体的示例中,融合所述第一特征图和所述第二特征图以获得分类特征图的过程,包括:计算所述第一特征图和所述第二特征图的按像素位置的加权和,以获得所述分类特征图。也就是,在像素级别所述第一特征图和所述第二特征图之间的加权和,以获得所述分类特征图。

在步骤7中,将所述分类特征图通过分类器以获得分类损失函数值。更具体地,在本申请实施例中,将所述分类特征图通过分类器以获得分类损失函数值的过程,包括:首先,将所述分类特征图通过一个或多个全连接层,以获得分类特征向量。也就是,以一个或多个全连接层作为编码器对所述分类特征图进行编码,以充分利用所述分类特征图中各个位置的信息。接着,将所述分类特征向量输入Softmax分类函数,以获得分类结果。接着,将所述分类结果和真实值输入损失函数,以获得所述分类损失函数值。这里,所述分类损失函数值表示所述分类结果符合所述真实值的概率。

图4图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法中,步骤7:将所述分类特征图通过分类器以获得分类损失函数值的流程图。如图4所示,在本申请实施例中,步骤7:将所述分类特征图通过分类器以获得分类损失函数值,包括:步骤71:将所述分类特征图通过一个或多个全连接层,以获得分类特征向量;步骤72:将所述分类特征向量输入Softmax分类函数,以获得分类结果;以及,步骤73:将所述分类结果和真实值输入损失函数,以获得所述分类损失函数值。

在步骤8中,基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。这是深度神经网络更新的常规过程,即通过BP算法来更新所述深度卷积神经网络的参数。

值得一提的是,在本申请实施例中,在基于所述融合交叉熵损失函数值和所述分类损失函数值的加权和更新所述深度卷积神经网络的参数的同时,还可以同步地更新所述分类器的参数。也就是,所述深度卷积神经网络与所述分类器可联合地进行训练。

综上,本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法被阐明,其中,在训练过程中,在以分类损失函数值训练神经网络的基础上,分别计算标签值与用于表征待检测对象的静态特征和动态特征之间的交叉熵函数值,并通过基于两者的交叉熵函数值的加权和来计算用于表征动态特征基于标签的迁移的融合交叉熵损失函数值,以此来在模型训练时有效地融合被检测对象的动态特征信息和静态特征信息。

根据本申请的另一方面,还提供了一种基于深度神经网络的稳定性检测方法。

图5图示了根据本申请实施例的基于深度神经网络的稳定性检测方法的流程图。如图5所示,根据本申请实施例的基于深度神经网络的稳定性检测方法,包括:S110,获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;以及,S120,将所述待检测图像输入根据如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法所训练的深度卷积神经网络和分类器,以获得分类结果,所述分类结果用于表示被吊运的板状构件的稳定性是否符合预设要求。

图6图示了根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练系统的框图。

如图6所示,根据本申请实施例的基于动态特征基于标签的迁移特征的神经网络的训练系统600,包括:监控视频获取单元610,用于执行步骤1:获取吊运设备吊运板状构件时的监控视频并从所述监控视频中提取当前帧和先前帧;标签值获取单元620,用于执行步骤2:获取所述当前帧对应的扭转传感器感应吊运板状构件的线缆的扭转值作为标签值;静态特征图生成单元630,用于执行步骤3:分别将所述监控视频获取单元610获得的所述当前帧和所述先前帧通过深度卷积神经网络,以获得第一特征图和第二特征图;动态特征图生成单元640,用于执行步骤4:将所述静态特征图生成单元630获得的所述第二特征图与所述第一特征图进行矩阵相乘,以获得第三特征图;融合交叉熵损失函数值计算单元650,用于执行步骤5:分别计算所述标签值获取单元620获得的所述标签值与所述静态特征图生成单元630获得的所述第一特征图的第一交叉熵函数值以及所述标签值获取单元620获得的所述标签值与所述动态特征图生成单元640获得的所述第三特征图的第二交叉熵函数值并计算所述第一交叉熵函数值和所述第二交叉熵函数值的加权和以获得融合交叉熵损失函数值;分类特征图生成单元660,用于执行步骤6:融合所述静态特征图生成单元630获得的所述第一特征图和所述第二特征图以获得分类特征图;分类损失函数值计算单元670,用于执行步骤7:将所述分类特征图生成单元660获得的所述分类特征图通过分类器以获得分类损失函数值;以及,参数更新单元680,用于执行步骤8:基于所述融合交叉熵损失函数值计算单元650获得的所述融合交叉熵损失函数值和所述分类损失函数值计算单元670获得的所述分类损失函数值的加权和,并通过梯度下降的反向传播来更新所述深度卷积神经网络的参数。

在一个示例中,在上述训练系统600中,所述分类特征图生成单元660,进一步用于计算所述第一特征图和所述第二特征图的按像素位置的加权和,以获得所述分类特征图。

在一个示例中,在上述训练系统600中,如图7所示,所述分类损失函数值计算单元670,包括:编码子单元671,用于将所述分类特征图通过一个或多个全连接层,以获得分类特征向量;分类结果获取子单元672,用于将所述分类特征向量输入Softmax分类函数,以获得分类结果;以及,损失函数值计算子单元673,用于将所述分类结果和真实值输入损失函数,以获得所述分类损失函数值。

在一个示例中,在上述训练系统600中,所述当前帧与所述先前帧之间具有预设时间间隔。

在一个示例中,在上述训练系统600中,所述深度卷积神经网络为深度残差网络。

这里,本领域技术人员可以理解,上述训练系统600中的各个单元和模块的具体功能和操作已经在上面参考图1到图4的基于动态特征基于标签的迁移特征的神经网络的训练方法的描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的训练系统600可以实现在各种终端设备中,例如用于稳定性检测的服务器等。在一个示例中,根据本申请实施例的训练系统600可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该训练系统600可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该训练系统600同样可以是该终端设备的众多硬件模块之一。

替换地,在另一示例中,该训练系统600与该终端设备也可以是分立的设备,并且该训练系统600可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。

根据本申请的另一方面,还提供了一种基于深度神经网络的稳定性检测系统。

图8图示了根据本申请实施例的基于深度神经网络的稳定性检测系统的框图。如图8所示,根据本申请实施例的基于深度神经网络的稳定性检测系统800,包括:待检测图像获取单元810,用于获取待检测图像,所述待检测图像为被吊运设备吊运的板状构件的图像;以及,分类结果生成单元820,用于将所述待检测图像获取单元810获得的所述待检测图像输入根据如上所述的基于动态特征基于标签的迁移特征的神经网络的训练方法所训练的深度卷积神经网络和分类器,以获得分类结果,所述分类结果用于表示被吊运的板状构件的稳定性是否符合预设要求。

这里,本领域技术人员可以理解,上述检测系统800中的各个单元和模块的具体功能和操作已经在上面参考图5的基于深度神经网络的稳定性检测方法描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的检测系统800可以实现在各种终端设备中,例如用于稳定性检测的服务器等。在一个示例中,根据本申请实施例的检测系统800可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该检测系统800可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该检测系统800同样可以是该终端设备的众多硬件模块之一。

替换地,在另一示例中,该检测系统800与该终端设备也可以是分立的设备,并且该检测系统800可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。

下面,参考图9来描述根据本申请实施例的电子设备。

图9图示了根据本申请实施例的电子设备的框图。

如图9所示,电子设备包括10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法,或者,基于深度神经网络的稳定性检测方法的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如第一特征图、第二特征图等各种内容。

在一个示例中,电子设备10还可以包括:输入系统13和输出系统14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入系统13可以包括例如键盘、鼠标等等。

该输出系统14可以向外部输出各种信息,包括检测结果等。该输出系统14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图9中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于动态特征基于标签的迁移特征的神经网络的训练方法,或者,基于深度神经网络的稳定性检测方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的基于动态特征基于标签的迁移特征的神经网络的训练方法,或者,基于深度神经网络的稳定性检测方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号