首页> 中国专利> 一种实现动态计算的高精度高比例的分类模型及分类方法

一种实现动态计算的高精度高比例的分类模型及分类方法

摘要

本申请涉及神经网络技术领域,提供一种实现动态计算的高精度高比例的分类模型及分类方法,高精度高比例的分类模型包括主干网络模型和至少一个第一分支网络模型;主干网络模型包括输入端、输出端和多个中间层,在多个中间层的1/4‑1/3的层数之间,插入第一分支网络模型;第一分支网络模型包括分类模块和置信度确定模块。在实际应用过程中,分类模块用于产生插入处的分类输出,置信度确定模块用于判断分类输出是否满足精度要求,若满足精度要求,则高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

著录项

  • 公开/公告号CN112633402A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 南京大学;

    申请/专利号CN202011607740.3

  • 发明设计人 王中风;王美琪;何鎏璐;林军;

    申请日2020-12-30

  • 分类号G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11363 北京弘权知识产权代理有限公司;

  • 代理人逯长明;许伟群

  • 地址 210023 江苏省南京市栖霞区仙林大道163号南京大学电子楼229

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本申请涉及神经网络技术领域,尤其涉及一种实现动态计算的高精度高比例的分类模型及分类方法。

背景技术

随着神经网络技术的发展与成熟,越来越多的工业领域采用深度神经网络技术完成工业任务,例如,通过图片数据学习获得的分类神经网络,对工业场景或者工业产品进行分类,相比于人工,分类神经网络不仅可以高效率的完成工作,而且极大的提高了准确率。

但是,在部分特殊应用场景下,由于深度神经网络的参数量及计算量较大,部署在计算平台上功耗与延时较高,导致应用场景受到极大的限制,为此很多单一的压缩方案或模型复杂度缩减方案被提出,如量化稀疏和动态计算等。

但是在实际使用过程中,由于工业场景的复杂性,会存在简单样本和复杂样本,例如,图片识别过程中,同样一个物体的多张图片,会因为光线、角度,图片大小和清晰度的不同,导致多张图片的识别难度也不相同,现有技术的方案,在识别一类图片时,其识别流程一致,虽然简单图片在识别时间会少于复杂图片的识别时间,但是仍然会存在过度利用片上资源识别简单图片的情况,从而造成时间及片上资源的浪费。

综上所述,在满足神经网络对输入分类精度要求的基础上,尽可能的提高分类效率及减少资源浪费,是本领域技术人员亟待解决的技术问题。

发明内容

为了在满足神经网络对输入分类精度要求的基础上,尽可能的提高分类效率及减少资源浪费,本申请提供一种实现动态计算的高精度高比例的分类模型及分类方法。

本申请第一方面提供一种实现动态计算的高精度高比例的分类模型,包括:主干网络模型和至少一个第一分支网络模型;所述主干网络模型包括输入端和输出端,以及设置在所述输入端和所述输出端之间的多个中间层,在多个中间层的1/4-1/3的层数之间,插入所述第一分支网络模型;

所述第一分支网络模型包括分类模块和置信度确定模块,所述分类模块包括依次相接的卷积层、池化层和全连接层;所述卷积层至少设置有第一卷积块,且所述第一卷积块包括并列的三组卷积,所述三组卷积的卷积核大小依次为3×3、5×5和7×7;所述池化层的步长为2,且所述池化层通过全连接层产生分类输出,并连接所述置信度确定模块;

所述置信度确定模块包括依次设置的softmax计算层、交叉熵计算层和阈值比较层;所述softmax计算层用于将全连接层的分类输出转化为概率张量并产生对应的二值向量,所述交叉熵计算层用于对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度,所述阈值比较层用于将所述预测置信度与阈值进行比较,并获得比较结果;

所述二值向量的产生方式为:将所述概率张量中最大的概率值位置置1,其他位置的概率值置0,获得二值向量;

若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则丢弃所述分类输出,返回主干网络模型的中间层继续进行预测计算。

可选的,所述卷积层还设置有至少一个第二卷积块,所述第二卷积块连接在所述第一卷积块之后,且所述第二卷积块的卷积核大小为3×3。

可选的,所述卷积层还设置第三卷积块,所述第三卷积块设置在所述第一卷积块之前,且所述第三卷积块的卷积核大小为1×1。

可选的,所述一种动态计算的高精度高比例网络模型还包括第二分支网络模型,所述第二分支网络模型插入多个中间层的1/2层数之后,所述第二分支网络模型的结构与所述第一分支网络的结构相同。

可选的,所述第一分支网络模型通过以下训练方法获得:

获取一组训练样本集,计算所述训练样本集的输出以及输出对应的标签向量的交叉熵,并将计算的交叉熵作为基本损失函数;

获取高精度高比例网络模型的总损失函数,所述高精度高比例网络模型的总损失函数为第一分支网络模型的基本损失函数与主网络模型的基本损失函数的线性和;

利用所述一组训练样本集和总损失函数,对第一分支网络原始模型进行预训练,获得第一分支网络初步模型;

获取提前退出置信度,所述提前退出置信度为第一分支网络初步模型的输出以及二值向量的交叉熵,利用提前退出置信度和验证样本集测试第一分支网络初步模型,获得阈值p;

利用整流函数对第一分支网络原始模型的基本损失函数进行整流,整流变化节点为1.5p,获得第一分支网络初步模型的基本损失函数;

对第一分支网络初步模型的基本损失函数和网络模型的基本损失函数进行重新组合,获得重新组合的总损失函数;

利用所述一组训练样本集和重新组合的总损失函数,对第一分支网络初步模型进行训练,或者第一分支网络模型。

可选的,在完成所述第一分支网络模型的训练之后,还包括:

获取一组主干网络训练样本集,利用所述一组主干网络训练样本集,对主干网络原始模型进行预训练,获得主干网络的初步模型;

将所述第一分支网络模型插入所述主干网络的初步模型,并利用所述第一分支网络模型的加权损失对插入第一分支网络模型的主干网络的初步模型进行训练,获得高精度高比例的初步分类模型;

对所述高精度高比例的初步分类模型进行稀疏和量化训练,获得所述一种实现动态计算的高精度高比例的分类模型。

可选的,所述总损失函数为:Loss=a*Loss

其中,Loss

所述整流函数为:

本申请第二方面提供一种实现动态计算的高精度高比例的分类方法,所述实现动态计算的高精度高比例的分类方法由权利要求1-7任一项所述的一种实现动态计算的高精度高比例的分类模型执行,包括:

所述主干网络模型的输入端获取分类输入,并沿主干网络模型顺序运行直至中间层,并得到所述中间层产生的中间过程特征数据;

所述第一分支网络模型从插入处的中间层获得中间过程特征数据;

所述第一分支网络模型的卷积层对中间过程特征数据进行卷积计算,获得卷积过程特征数据;

所述池化层对所述卷积过程特征数据进行数据降维,获得降维特征数据;

所述全连接层获取所述降维特征数据,并生成分类输出;

所述softmax计算层将分类输出转化为张量并产生对应的二值向量;

所述交叉熵计算层对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度;

所述阈值比较层将所述预测置信度与阈值进行比较,并获得比较结果;

若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则所述第一分支网络模型的输出端丢弃所述分类输出,并返回主干网络的中间层继续进行分类运算。

本申请第三方面提供一种计算机设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如本申请第二方面提供的一种实现动态计算的高精度高比例的分类方法的步骤。

本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理执行时实现如本申请第二方面提供的一种高精度高比例的分类方法的步骤。

本申请提供一种实现动态计算的高精度高比例的分类模型及分类方法,以及实现所述分类模型及分类方法的一种计算机设备和一种计算机可读存储介质。所述高精度高比例的分类模型包括:主干网络模型和至少一个第一分支网络模型;所述主干网络模型包括输入端和输出端,以及设置在所述输入端和所述输出端之间的多个中间层,在多个中间层的1/4-1/3的层数之间,插入所述第一分支网络模型;所述第一分支网络模型包括分类模块和置信度确定模块,所述分类模块包括依次相接的卷积层、池化层和全连接层;所述卷积层至少设置有第一卷积块,且所述第一卷积块包括并列的三组卷积,所述三组卷积的卷积核大小依次为3×3、5×5和7×7;所述池化层的步长为2,且所述池化层通过全连接层产生分类输出,并连接所述置信度确定模块;所述置信度确定模块包括依次设置的softmax计算层、交叉熵计算层和阈值比较层;所述softmax计算层用于将分类输出转化为张量并产生对应的二值向量,所述交叉熵计算层用于对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度,所述阈值比较层用于将所述预测置信度与阈值进行比较,并获得比较结果;若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则丢弃所述分类输出,返回主干网络模型的中间层继续进行预测计算。

在实际应用过程中,分类模块,用于产生插入处的分类输出,所述置信度确定模块,用于判断对于某一个分类输入,在所述分类模块产生的分类输出是否满足精度要求,若满足精度要求,则所述高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃所述分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

附图说明

为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种实现动态计算的高精度高比例的分类模型结构示意图;

图2为本申请实施例提供的分支网络模型结构示意图;

图3为本申请实施例提供的具备两个分支网络模型的分类模型结构示意图;

图4为本申请实施例提供的分支网络模型的训练流程示意图;

图5为本申请实施例提供的主干网络模型的训练流程示意图;

图6为本申请实施例提供的一种实现动态计算的高精度高比例的分类方法流程示意图。

具体实施方式

为了在满足神经网络对输入分类精度要求的基础上,尽可能的提高神经网络的分类效率及减少资源浪费。如图1所示,为本申请实施例提供的一种实现动态计算的高精度高比例的分类模型结构示意图。本申请实施例第一方面提供一种实现动态计算的高精度高比例的分类模型,包括:主干网络模型和至少一个第一分支网络模型;所述主干网络模型包括输入端和输出端,以及设置在所述输入端和所述输出端之间的多个中间层,在多个中间层的1/4-1/3的层数之间,插入所述第一分支网络模型。

所述第一分支网络模型按照功能分类,包括两大部分,第一部分为分类模块,用于产生插入处的分类输出,即分类预测结果;第二部分为置信度确定模块,用于判断对于某一个分类输入,在所述分类模块产生的分类输出是否满足精度要求,若满足精度要求,则所述高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃所述分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

其中,如图2所示,为本申请实施例提供的分支网络模型结构示意图,为了通过所述分类模块提前预测出分类输出,所述分类模块包括依次相接的卷积层、池化层和全连接层;所述卷积层至少设置有第一卷积块,且所述第一卷积块包括并列的三组卷积,所述三组卷积的卷积核大小依次为3×3、5×5和7×7;所述池化层的步长为2,且所述池化层通过全连接层产生分类输出,并连接所述置信度确定模块。

其中,如图2所示,所述置信度确定模块包括依次设置的softmax计算层、交叉熵计算层和阈值比较层;所述softmax计算层用于将全连接层的分类输出转化为概率张量并产生对应的二值向量,所述交叉熵计算层用于对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度,所述阈值比较层用于将所述预测置信度与阈值进行比较,并获得比较结果,所述阈值提前设置,用于判断所述预测置信度是否满足所述高精度高比例的分类模型的预测精度。

若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则丢弃所述分类输出,返回主干网络模型的中间层继续进行预测计算。

其中,所述二值向量产生方式为:例如,某个样本softmax的输出的概率张量为[0.08,0.01,0.91],则产生对应二值向量时,将其中最大的概率值位置置1,其他位置置0,即二值向量为[0,0,1]。将[0.08,0.01,0.91]与[0,0,1]做交叉熵计算,得到的结果即可作为评价这一样本的预测置信度。将预测置信度与提前设定好的阈值做比较,若比较结果为预测置信度大于所述阈值,则说明这一点的预测结果是正确样本的概率过低,即返回主干网络模型的中间层继续完成余下的分类运算,第一分支网络模型的分类输出直接丢弃;若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出,所述高精度高比例的分类模型的分类运算,在所述第一分支网络模型出提前退出。

本申请实施例提供的一种实现动态计算的高精度高比例的分类模型,将动态计算与量化稀疏的网络模型想融合,进一步降低网络平均延时以及平均功耗。这一融合压缩方案将针对输入冗余的动态计算和针对网络参数冗余的稀疏量化方法同时使用,这种结合方法因为利用的是不同部分的冗余,所以一起使用后可以达到互不影响精度的效果,从而可以建立一个高压缩率同时保持高精度的网络模型。

如图2所示,在本申请的部分实施例中,所述卷积层还设置有至少一个第二卷积块,所述第二卷积块连接在所述第一卷积块之后。

其中,在分类运算简单的情况下,例如,在图片识别分类中,图像分辨率较小,且类别数较少,容易分类数据集中,如CIFAR 10数据,可以至设置第一卷积块,或者在所述第一卷积块后再设置一个第二卷积块。但是,在部分分类运算更复杂的场景下,为了保证分类输出的精度,例如,图像分辨率较大,类别数较多的困难数据集,如ImageNet数据集,可以在第一卷积块后再设置多个第二卷积块结构,且所述第二卷积块的卷积核大小为3×3。

在困难数据集如ImageNet数据集,其主干网络模型进入第一分支网络模型的通道数较大,会给第一分支网络模型带来的额外计算量,为了避免增加所述第一分支网络模型的额外计算量,为了避免所述高精度高比例的分类模型的计算量和存储量超过片上的部署平台资源上限,同时确保高精度高比例的分类模型整体的压缩率,如图2所示,在本申请的部分实施例中,在满足分类预测精度需求的前提下,所述卷积层还设置第三卷积块,所述第三卷积块设置在所述第一卷积块之前,且所述第三卷积块的卷积核大小为1×1。

对于较深层的网络模型,例如所述主主干网络模型的中间层层数大于50层,此时插入一个第一分支网络模型,在所述第一分支网络完成提前预测并退出的概率较低,即较难满足分类预测精度需求,从而需要所述主干网络模型完成整个分类预算,导致仍然需要占用较大的片上资源,为了解决这一问题,如图3所示,为本申请实施例提供的具备两个分支网络模型的分类模型结构示意图,在本申请分部分实施例中,所述一种动态计算的高精度高比例网络模型还包括第二分支网络模型,所述第二分支网络模型插入多个中间层的1/2层数之后,所述第二分支网络模型的结构与所述第一分支网络的结构相同。即所述第一分支网络模型与所述第二分支网络模型均为所述主干网络模型的分支结构。

本申请实施例提供的高精度高比例的分类模型,通过机器学习获得,在进行机器学习时,可以先对分支网络模型(第一分支网络模型和第二分支网络模型)进行训练,再对所述主干网络模型进行训练;也可以先对所述主干网络模型进行训练,再对分支网络模型(第一分支网络模型和第二分支网络模型)进行训练。本申请实施例提供的训练顺序为:先训练分支网络模型,再训练主干网络模型。

其中,如图4所示,所述第一分支网络模型的训练过程包括步骤S401至步骤S407。

步骤S401,获取一组训练样本集,计算所述训练样本集的输出以及输出对应的标签向量的交叉熵,并将计算的交叉熵作为基本损失函数。

步骤S402,获取高精度高比例网络模型的总损失函数,所述高精度高比例网络模型的总损失函数为第一分支网络模型的基本损失函数与主网络模型的基本损失函数的线性和。

其中,所述总损失函数为:Loss=a×Loss

步骤S403,利用所述一组训练样本集和总损失函数,对第一分支网络原始模型进行预训练,获得第一分支网络初步模型。

步骤S404,获取提前退出置信度,所述提前退出置信度为第一分支网络初步模型的输出以及二值向量的交叉熵,利用提前退出置信度和验证样本集测试第一分支网络初步模型,获得阈值p。其中,阈值p的确定还需要考虑高精度高比例的分类模型的精度要求,本申请实施例中,将所述阈值p定为提前退出置信度的1.5倍。

步骤S405,利用整流函数对第一分支网络原始模型的基本损失函数进行整流,整流变化节点为1.5p,获得第一分支网络初步模型的基本损失函数。

其中,所述整流函数为:

整流函数的目的是对高损失值的样本,也就是困难样本,将其梯度变为原来的十分之一倍。因为对于困难样本,高精度高比例的分类模型并不会使用分支网络模型(第一分支网络模型和第二分支网络模型)的分类输出作为最后的输出结果,这样可以避免过分关注分支网络模型对困难样本的梯度下降,而降低分支网络模型在简单样本上的表现。

步骤S406,对第一分支网络初步模型的基本损失函数和网络模型的基本损失函数进行重新组合,获得重新组合的总损失函数。

其中,重新组合的总损失函数,重新对分支网络模型(第一分支网络模型和第二分支网络模型)进行训练。重新组合的总损失函数为:

Loss=a×f(Loss

步骤S407,利用所述一组训练样本集和重新组合的总损失函数,对第一分支网络初步模型进行训练,或者第一分支网络模型。

需要说明的,所述分支网络模型(第一分支网络模型和第二分支网络模型)与所述主干网络模型的训练顺序可以改变,例如,先训练主干网络模型,再使用上文所提的损失函数训练分支网络模型。但需要说明的是,一定先完成步骤S401至步骤S405,根据预训练结果,获得第一分支网络初步模型,以确定最终用于训练的整流变化节点1.5p。

需要说明的是,整流函数只需对高Loss整流。若高精度高比例的分类模型具有多个分支网络模型(即,包括第一分支网络模型以外的分支网络模型),从第n个分支得到的样本提前退出置信度范围为pn-1至pn,那么,仍然只需要f(x,p

需要说明的是,整流函数还可以选其它形式,对于各个线性参数的具体取值,应视作超参数来调节。

本申请实施例,在完成步骤S401-步骤S407对于第一分支网络模型的训练之后,如图5所示,采用步骤S501至步骤S503训练所述主干网络模型。

步骤S501,获取一组主干网络训练样本集,利用所述一组主干网络训练样本集,对主干网络原始模型进行预训练,获得主干网络的初步模型。

获得一个神经网络原始模型,例如,一个普通的卷积神经网络网络,或者Transformer等网络,利一组主干网络训练样本集对其进行预训练,直到其收敛到最好的精度,获得主干网络的初步模型。

步骤S502,将所述第一分支网络模型插入所述主干网络的初步模型,并利用所述第一分支网络模型的加权损失对插入第一分支网络模型的主干网络的初步模型进行训练,获得高精度高比例的初步分类模型。

对于步骤S501预训练好的主干网络的初步模型,将按照步骤S401至步骤S407训练好的第一分支网络模型(或者还包括按照同样方法训练的第二分支网络模型)插入主干网络的初步模型,利用第一分支网络模型(或者还包括按照同样方法训练的第二分支网络模型)的加权损失做训练,直到主干网络的初步模型收敛到相对较好的精度。

步骤S503,对所述高精度高比例的初步分类模型进行稀疏和量化训练,获得所述一种实现动态计算的高精度高比例的分类模型。

其中,在完成步骤S503之后,所述高精度高比例的分类模型中包括被训练完成的主干网络的模型。所述稀疏训练的稀疏格式不限,例如将不重要的值(比如较小的网络参数值)在训练中置零或剪枝掉某些通道。所述量化训练过程中的位宽不做严格限制,但不能小于网络模型可以承受的最小位宽,对于大多数网络来说,网络可承受的最小位宽典型值为8比特或6比特。上述稀疏和量化训练,可以对所述主干网络模型或者分支网络模型(第一分支网络模型和第二分支网络模型)同时施加。

本申请实施例第二方面还提供一种实现动态计算的高精度高比例的分类方法,所述实现动态计算的高精度高比例的分类方法由本申请实施例第一方面提供的一种实现动态计算的高精度高比例的分类模型执行,如图6所示,为本申请实施例提供的一种实现动态计算的高精度高比例的分类方法流程示意图,包括步骤S601至步骤S609,对于所述高精度高比例的分类方法中未详细介绍的技术内容,请参照本申请实施例第一方面提供的实现动态计算的高精度高比例的分类模型。

步骤S601,所述主干网络模型的输入端获取分类输入,并沿主干网络模型顺序运行直至中间层,并得到所述中间层产生的中间过程特征数据。

步骤S602,所述第一分支网络模型从插入处的中间层获得中间过程特征数据。

步骤S603,所述第一分支网络模型的卷积层对中间过程特征数据进行卷积计算,获得卷积过程特征数据。

步骤S604,所述池化层对所述卷积过程特征数据进行数据降维,获得降维特征数据。

步骤S605,所述全连接层获取所述降维特征数据,并生成分类输出。

步骤S606,所述softmax计算层将分类输出转化为张量并产生对应的二值向量。

步骤S607,所述交叉熵计算层对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度。

步骤S608,所述阈值比较层将所述预测置信度与阈值进行比较,并获得比较结果。

步骤S609,若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则所述第一分支网络模型的输出端丢弃所述分类输出,并返回主干网络的中间层继续进行分类运算。

本申请实施例第三方面提供一种计算机设备,包括:

存储器,用于存储计算机程序。

处理器,用于执行所述计算机程序时实现如本申请实施例第二方面提供的一种高精度高比例的分类方法的步骤。

存储器,用于存储计算机程序。

处理器,用于执行所述计算机程序时实现如本申请第二实施例所述的图片去雾及识别方法的步骤。

本申请实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理执行时实现如本申请实施例第二方面提供的一种高精度高比例的分类方法的步骤。

由以上技术方案可知,本申请实施例提供一种实现动态计算的高精度高比例的分类模型及分类方法,以及实现所述分类模型及分类方法的一种计算机设备和一种计算机可读存储介质。所述高精度高比例的分类模型包括:主干网络模型和至少一个第一分支网络模型;所述主干网络模型包括输入端和输出端,以及设置在所述输入端和所述输出端之间的多个中间层,在多个中间层的1/4-1/3的层数之间,插入所述第一分支网络模型;所述第一分支网络模型包括分类模块和置信度确定模块,所述分类模块包括依次相接的卷积层、池化层和全连接层;所述卷积层至少设置有第一卷积块,且所述第一卷积块包括并列的三组卷积,所述三组卷积的卷积核大小依次为3×3、5×5和7×7;所述池化层的步长为2,且所述池化层通过全连接层产生分类输出,并连接所述置信度确定模块;所述置信度确定模块包括依次设置的softmax计算层、交叉熵计算层和阈值比较层;所述softmax计算层用于将分类输出转化为张量并产生对应的二值向量,所述交叉熵计算层用于对所述张量以及对应的二值向量做交叉熵计算,获得预测置信度,所述阈值比较层用于将所述预测置信度与阈值进行比较,并获得比较结果;若比较结果为预测置信度小于或者等于所述阈值,则所述第一分支网络模型的输出端输出所述分类输出;若比较结果为预测置信度大于所述阈值,则丢弃所述分类输出,返回主干网络模型的中间层继续进行预测计算。

在实际应用过程中,分类模块,用于产生插入处的分类输出,所述置信度确定模块,用于判断对于某一个分类输入,在所述分类模块产生的分类输出是否满足精度要求,若满足精度要求,则所述高精度高比例的分类模型在第一分支网络模型的输出端提前退出,若不满足精度要求,则放弃所述分类模块产生的分类输出,并返回主干网络模型的中间层,继续完成分类运算。

以上结合具体实施方式和范例性实例对本申请进行了详细说明,不过这些说明并不能理解为对本申请的限制。本领域技术人员理解,在不偏离本申请精神和范围的情况下,可以对本申请技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本申请的范围内。本申请的保护范围以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号