首页> 中国专利> 获取深度一次性学习模型的方法、图像识别方法及装置

获取深度一次性学习模型的方法、图像识别方法及装置

摘要

本发明公开了一种获取深度一次性学习模型的方法、图像识别方法及装置,获取深度一次性学习模型的方法包括:将包含少量目标图像和背景图像的预设数据集中每一幅目标图像输入预设CNN模型,选择预设CNN模型隐含层中任一层输出图像作为该目标图像的特征图像集;采用预设数据集中背景图像,通过PCA方法确定降维矩阵,对所有特征图像集进行降维,生成降维特征图像集;将所有降维特征图像集输入预设贝叶斯学习模型,对降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;采用预设数据集对深度一次性学习模型进行训练,直到模型收敛,获取收敛后的深度一次性学习模型。采用收敛后的深度一次性学习模型对图像进行识别,识别率较高。

著录项

  • 公开/公告号CN106372656A

    专利类型发明专利

  • 公开/公告日2017-02-01

    原文格式PDF

  • 申请/专利权人 同观科技(深圳)有限公司;

    申请/专利号CN201610761364.0

  • 发明设计人 史方;邹佳运;王标;樊强;

    申请日2016-08-30

  • 分类号G06K9/62(20060101);

  • 代理机构北京弘权知识产权代理事务所(普通合伙);

  • 代理人逯长明;许伟群

  • 地址 518057 广东省深圳市南山区高新区南环路29号留学生创业大厦22楼04号

  • 入库时间 2023-06-19 01:29:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-10

    授权

    授权

  • 2017-03-01

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20160830

    实质审查的生效

  • 2017-02-01

    公开

    公开

说明书

技术领域

本发明涉及图像识别技术领域,尤其涉及一种获取深度一次性学习模型的方法、图像识别方法及装置。

背景技术

现有技术中,想要对待识别图像进行识别分类时,可以采用训练好的各类网络学习模型对待识别图像进行识别分类,例如:可以采用卷积神经网络CNN(Convolutional Neural Network,CNN)模型对待识别图像进行识别,也可以采用贝叶斯学习模型对待识别图像进行识别,同样,也可以采用其它网络学习模型对待识别图像进行识别。

采用CNN模型对待识别图像进行识别时,首先需要构建CNN模型,并采用大量标定好的数据对该CNN模型进行训练,之后采用训练好的CNN模型对待识别图像进行识别,即可精确确定待识别图像中是否包含待识别物体,进而对待识别图像进行分类。而在实际应用中,通常难以获取到大量标定好的数据,只能获取少量标定好的数据样本,这样,如果仍然选择CNN模型对待识别图像进行识别的话,由于对CNN模型进行训练的标定好的数据样本的数量较少,获得的CNN模型存在一定的过拟合现象,会导致最后的识别率非常低,识别效果较差。

所以,基于少量样本训练获取的CNN模型存在一定的过拟合现象,对图像识别的精确度较低,适用性较差。

发明内容

本发明实施例的目的在于提供一种获取深度一次性学习模型的方法、图像识别方法及装置,以解决基于少量样本训练获取的CNN模型存在一定的过拟合现象,对图像识别的精确度较低,适用性较差的问题。

为了解决上述技术问题,本发明实施例公开了如下技术方案:

第一方面,本发明实施例提供了一种获取深度一次性学习模型的方法,该方法包括:

针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;

采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;

采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;

采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。

结合第一方面,在第一方面的第一种可能的实现方式中,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集的过程,具体包括:

选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;

In={I1n,I2n,...,IKn};

采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;

Iin=σ(Win*In-1+Bin);

其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。

结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集的过程,具体包括:

采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

I′n=In·WC

其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。

结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型的过程,具体包括:

将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;

R=p(C|In)p(Cbg|In)p(In|θ)p(C)p(In|θbg)p(Cbg);

其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;

p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;

通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;

p(In|θ)=ΣhHp(In,h|θ)=ΣhHp(In|h,θ)p(h|θ);

其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;

通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;

p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);

其中,h0表示零假设方法中采用的索引向量;

将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;

p(In|h,θ)=Πq=1QG(In(hq)|μ,Γ)Πj=1,jhKG(In(j)|μbg,Γbg);

其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;

将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;

p(In|h0,θbg)=Πj=1KG(In(j)|μbg,Γbg);

根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;

Rp(In|h,θ)p(In|h0,θbg)=Πq=1QG(In(hq)|μ,Γ)G(In(hq)|μbg,Γbg).

第二方面,本发明公开了一种采用上述收敛后的深度一次性学习模型进行图像识别的方法,该方法包括:

将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;

采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;

将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。

第三方面,本发明公开了一种获取深度一次性学习模型的装置,该装置包括:

特征图像集获取模块,用于针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;

降维矩阵确定模块,用于采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;

第一降维运算模块,用于采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

深度一次性学习模型构建模块,用于将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;

模型训练模块,用于采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。

结合第三方面,在第三方面的第一种可能的实现方式中,所述特征图像集获取模块具体用于:

针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;

In={I1n,I2n,...,IKn};

采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;

Iin=σ(Win*In-1+Bin);

其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。

结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,所述第一降维运算模块具体用于:

采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

I′n=In·WC

其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。

结合第三方面的第二种可能的实现方式,在第三方面的第三种可能的实现方式中,所述深度一次性学习模型构建模块具体用于:

将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;

R=p(C|In)p(Cbg|In)p(In|θ)p(C)p(In|θbg)p(Cbg);

其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;

p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;

通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;

p(In|θ)=ΣhHp(In,h|θ)=ΣhHp(In|h,θ)p(h|θ);

其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;

通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;

p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);

其中,h0表示零假设方法中采用的索引向量;

将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;

p(In|h,θ)=Πq=1QG(In(hq)|μ,Γ)Πj=1,jhKG(In(j)|μbg,Γbg);

其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;

将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;

p(In|h0,θbg)=Πj=1KG(In(j)|μbg,Γbg);

根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;

Rp(In|h,θ)p(In|h0,θbg)=Πq=1QG(In(hq)|μ,Γ)G(In(hq)|μbg,Γbg).

第四方面,本发明公开了一种采用上述收敛后的深度一次性学习模型进行图像识别的装置,该装置包括:

待识别特征图像集获取模块,用于将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;

第二降维运算模块,用于采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;

图像识别模块,用于将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。

本发明的实施例提供的技术方案可以包括以下有益效果:本发明提供了一种获取深度一次性学习模型的方法、图像识别方法及装置,本发明提供的获取深度一次性学习模型的方法中,基于包含少量目标图像和背景图像的少量数据集(数据集中包含的标定好的样本数据量少或样本较单一),构建了深度一次性学习模型,并且采用该少量数据集对深度一次性学习模型进行训练,最后得到了收敛后的深度一次性学习模型,通过实验证明,采用本发明提供的方法获得的深度一次性学习模型对图像的识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更好。

本发明实施例应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种获取深度一次性学习模型的方法的流程示意图;

图2为本发明实施例提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的方法的流程图;

图3为本发明实施例提供的一种获取深度一次性学习模型的装置的结构框图;

图4为本发明实施例提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

本发明提供了一种获取深度一次性学习模型的方法、图像识别方法及装置,本发明提供的方法中,能够基于少量样本构建深度一次性学习模型,并采用含有少量样本的数据集对深度一次性学习模型进行训练,最后获得收敛后的深度一次性学习模型,经过实际实验检验,将该收敛后的深度一次性学习模型应用于实际的图像识别过程中,与基于少量样本训练获取的CNN模型相比,对图像识别的精确度显著提升,识别率更高,适用性更好。

下面结合附图,详细介绍本发明的具体实施例。

如图1所示,图1示出的是本发明提供的一种获取深度一次性学习模型的方法的流程图,该方法包括:

步骤101、针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集。

通常,人们想要获取用于对待识别图像进行图像识别分类的某种网络学习模型时,需要先获取一定量的标定好的样本数据构建网络学习模型,并通过一定量的标定好的样本数据对网络学习模型进行训练直到收敛,获得收敛后的网络学习模型,之后采用收敛后的网络学习模型即可对待识别图像进行图像识别并分类,因此,想要获取深度一次性学习模型,首先需要获取一定量的标定好的样本数据。

本实施例中在开始获取深度一次性学习模型之前,首先会获取包含少量目标图像和背景图像的数据集,该数据集中图像的数量小于2000幅,可以为几百幅,之后将该数据集预存于用于获取深度一次性学习模型的系统中,在获取深度一次性学习模型时直接使用即可,因此,本文中将该数据集定义为预设数据集,其中,目标图像为被标注为包含待识别物体的图像,背景图像为被标注为不包含待识别物体的图像,本文中,将人们想要在待识别图像中识别确认是否包含的目标物体定义为待识别物体。具体实施过程中,可以通过人工标注的方式获取预设数据集,例如,将包含有待识别物体的图像人工标注为目标图像,将不包含待识别物体的图像人工标注为背景图像,之后将人工标注好的目标图像和背景图像预存于用于获取深度一次性学习模型的系统中,便可获得预设数据集。

本实施例提供的获取深度一次性学习模型的方法中,通过采用预设贝叶斯学习模型对预设数据集中的目标图像进行识别,从而构建深度一次性学习模型,而对图像的识别实质上是确定图像中是否包含待识别物体,确定图像中是否包含待识别物体可以通过比较图像中包含待识别物体的概率与图像中不包含待识别物体,即包含背景(本文中,将图像中待识别物体之外的其余物体均定义为背景)的概率的大小关系来确定,如果图像中包含待识别物体的概率大于图像中包含背景的概率,则可以确定图像中包含待识别物体,因此,采用预设贝叶斯学习模型对预设数据集中的目标图像的识别过程可以表示为通过预设贝叶斯学习模型确定目标图像中包含待识别物体的概率与目标图像中包含背景的概率的大小关系。

通过预设贝叶斯学习模型确定目标图像中包含待识别物体的概率以及目标图像中包含背景的概率,需要先确定目标图像的特征图像集,具体实施时,可以采用CNN模型提取目标图像的特征图像集,因此,在开始获取深度一次性学习模型之前,还需要先获取CNN模型,之后将CNN模型预存于用于获取深度一次性学习模型的系统中,在获取深度一次性学习模型的过程中,直接使用即可,因此,本文中,将该CNN模型定义为预设CNN模型,该预设CNN模型可以为下述CNN模型中的任意一种:第一种CNN模型为采用大量标定好的样本数据训练获得的CNN模型;第二种CNN模型为采用少量标定好的样本数据训练获得的CNN模型。

采用预设CNN模型提取预设数据集中所有目标图像中每一幅目标图像的特征图像集时,将该目标图像输入所述预设CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,具体实施时,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集的过程,包括:

选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;

In={I1n,I2n,...,IKn};

采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;

Iin=σ(Win*In-1+Bin);

其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量(每个特征图像集In中包含多幅特征图像),(*)表示卷积运算,函数σ(·)表示激活响应函数。

步骤102、采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵。

具体实施时,将预设数据集中所有背景图像中的每一幅背景图像输入预设CNN模型中,提取预设CNN模型第n层隐含层的输出图像作为该背景图像的背景特征图像集,并确定出该背景特征图像集对应的背景特征矩阵,之后对预设数据集中所有背景图像对应的所有背景特征矩阵进行主成分分析PCA(Principal Component Analysis,PCA),生成系数矩阵,最后选择该系数矩阵的前C列作为降维矩阵,其中,C的取值需要满足下述条件:使得PCA的特征值的累计贡献率达到90%以上。例如:假设预设数据集中背景图像的数量为20,对于其中的一幅背景图像,其对应一个256×169的背景特征矩阵,20幅背景图像就组成一个5120×169的背景特征矩阵,对该背景特征矩阵进行主成分分析后,可以生成一个169×169的系数矩阵,选择该系数矩阵的前C列做为降维矩阵。

步骤103、采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集。

具体实施时,该过程具体包括:采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

I′n=In·WC

其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。

步骤104、将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型。

具体实施时,该过程具体包括:将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;

R=p(C|In)p(Cbg|In)p(In|θ)p(C)p(In|θbg)p(Cbg);

其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像,R表示预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率与预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率的比值;

通常情况下,每个概率符合某一种概率分布的概率分布函数中均含有参数,而后验概率p(C|I′n)是一个概率分布函数,因此,后验概率p(C|I′n)中隐含有参数θ,表示这个后验概率p(C|I′n)符合某一个概率分布,并且这个概率分布的参数为θ,同理,后验概率p(Cbg|I′n)中隐含有参数θbg,由此,下式可以变形为如下形式:

p(C|In)p(Cbg|In)=p(C|θ,In)p(C|θbg,In)=p(In|C,θ)p(C,θ)p(In,θ)·p(In,θbg)p(In|Cbg,θbg)p(Cbg,θbg);

其中,p(C,θ)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,可以简写为p(C),p(Cbgbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率,可以简写为p(Cbg),p(I′n,θ)为证据因子,目的是为了保证各类别的后验概率的和为1,通常该证据因子为常数,同理,p(I′nbg)也是一个常数,这样上述公式可以简化为:其中,p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;

通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n(每个降维特征图像集I′n中均包含多个降维特征图像)中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;

p(In|θ)=ΣhHp(In,h|θ)=ΣhHp(In|h,θ)p(h|θ);

其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;

通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;

p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);

其中,h0表示零假设方法中采用的索引向量;

由于p(h|θ)为常量,假设p(I′n|h,θ)满足高斯分布,则可以将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;

p(In|h,θ)=Πq=1QG(In(hq)|μ,Γ)Πj=1,jhKG(In(j)|μbg,Γbg);

其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;

对于背景图像,所有表征背景特征的背景降维特征图像都不会被h选择,因此可以将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;

p(In|h0,θbg)=Πj=1KG(In(j)|μbg,Γbg);

当将一幅目标图像输入预设CNN模型,通过该预设CNN模型提取到该目标图像的特征图像集,并通过降维矩阵进行降维,得到目标图像的降维特征图像集之后,p(I′n|h0bg)是一个定值,并且,p(C)/p(Cbg)为常量,因此,可以根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建出下述深度一次性学习模型:

Rp(In|h,θ)p(In|h0,θbg)=Πq=1QG(In(hq)|μ,Γ)G(In(hq)|μbg,Γbg).

步骤105、采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。

采用预设数据集对深度一次性学习模型进行训练的方法包括多种,例如,第一种方法,采用预设数据集,通过期望最大化EM(Expectation Maximization,EM)方法对深度一次性学习模型进行训练;第二种方法,采用预设数据集,通过MM(Majorize-Minimize,MM)方法对深度一次性学习模型进行训练;第三种方法,采用预设数据集,通过条件期望最大化ECM(Expectation conditional maximization,ECM)方法对深度一次性学习模型进行训练;第四种方法,采用预设数据集,通过α-EM(α-Expectation–maximization,α-EM)方法对深度一次性学习模型进行训练;采用前述任意一种方法对深度一次性学习模型进行训练,直到模型收敛后,就可以获得深度一次性学习模型中μ和Γ的值,将获得的μ和Γ的值代入到深度一次性学习模型中,就可以获得收敛后的深度一次性学习模型。

当用于训练获取网络学习模型的标定好的样本数量较少或较单一时,采用本实施例提供的方法获得的深度一次性学习模型对其它图像的识别率具有显著的提高。例如以对车的识别为例:通过实验证明,采用相同数据样本训练获得的CNN模型和深度一次性学习模型,用二者分别对80幅图像进行识别,CNN模型的识别率为65%,而深度一次性学习模型的识别率为71.25%,识别率明显提高。

本发明提供的获取深度一次性学习模型的方法中,基于包含少量目标图像和背景图像的少量数据集,构建了深度一次性学习模型,并且采用该少量数据集对深度一次性学习模型进行训练,最后得到了收敛后的深度一次性学习模型,通过实验证明,采用本发明提供的方法获得的深度一次性学习模型对图像的识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更佳,适用性更好。

如图2所示,图2示出的是本发明提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的方法的流程图,该方法包括:

步骤201、将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集。

步骤202、采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集。

步骤203、将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。

步骤201和步骤202的实现方式可以参考上述实施例中相应的实现方式,在此不再赘述,在步骤203中,将待识别降维特征图像集输入收敛后的深度一次性学习模型中,通过该收敛后的深度一次性学习模型计算出R后,比较R与后验概率比值的预设阈值之间的大小关系,其中,后验概率比值的预设阈值可以在0.5~1.5中任意选取,如果R大于等于该后验概率比值的预设阈值,则可以确定待识别图像中包含待识别物体,如果R小于该后验概率比值的预设阈值,则可以确定待识别图像中不包含待识别物体。

本实施例提供的方法,由于采用了上述深度一次性学习模型对待识别图像进行识别,识别的准确率更高。

与上述方法相对应,本发明实施例还公开了一种获取深度一次性学习模型的装置以及一种采用上述收敛后的深度一次性学习模型进行图像识别的装置。

如图3所示,图3示出的是一种获取深度一次性学习模型的装置的结构框图,该装置300包括:

特征图像集获取模块301,用于针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型隐含层中任意一层的输出图像作为该目标图像的特征图像集,所述目标图像为被标注为包含待识别物体的图像,所述背景图像为被标注为不包含待识别物体的图像;

降维矩阵确定模块302,用于采用所述预设数据集中的背景图像,通过主成分分析PCA方法确定降维矩阵;

第一降维运算模块303,用于采用所述降维矩阵对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

深度一次性学习模型构建模块304,用于将所有降维特征图像集中的每一个降维特征图像集输入预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别,构建深度一次性学习模型;

模型训练模块305,用于采用所述预设数据集对所述深度一次性学习模型进行训练,直到模型收敛,从而获取收敛后的深度一次性学习模型。

进一步,所述特征图像集获取模块301具体用于:

针对包含少量目标图像和背景图像的预设数据集中的所有目标图像,将每一幅目标图像输入预设卷积神经网络CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该目标图像的特征图像集,将所述特征图像集表示为下述特征矩阵;

In={I1n,I2n,...,IKn};

采用激活响应函数按照下述公式计算所述特征矩阵中的矩阵元素从而确定所述特征图像集;

Iin=σ(Win*In-1+Bin);

其中,In表示预设CNN模型第n层隐含层的输出图像,即所述特征图像集,表示所述特征图像集对应的特征矩阵的第i个矩阵元素,即特征图像集In中的第i个特征图像,I0表示输入预设CNN模型的所述目标图像,表示预设CNN模型第n层隐含层中第i个滤波器,表示预设CNN模型第n层隐含层中第i个偏置矩阵,1≤i≤K,K表示预设CNN模型第n层隐含层中卷积核数量,即特征图像集In中的特征图像的数量,(*)表示卷积运算,函数σ(·)表示激活响应函数。

进一步,所述第一降维运算模块303具体用于:

采用所述降维矩阵,根据下述公式对所述预设数据集中每一幅目标图像的特征图像集进行降维,生成该目标图像的降维特征图像集;

I′n=In·WC

其中,I′n表示降维特征图像集,In表示特征图像集,WC表示降维矩阵。

进一步,所述深度一次性学习模型构建模块304具体用于:

将所有降维特征图像集中的每一个降维特征图像集输入下述预设贝叶斯学习模型,对该降维特征图像集对应的目标图像进行识别;

R=p(C|In)p(Cbg|In)p(In|θ)p(C)p(In|θbg)p(Cbg);

其中,p(C|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为目标图像的后验概率,C表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为目标图像,p(Cbg|I′n)表示在获得降维特征图像集I′n的前提下,预设贝叶斯学习模型将输入其中的降维特征图像集I′n对应的目标图像识别为背景图像的后验概率,Cbg表示预设贝叶斯学习模型识别输入的降维特征图像集I′n对应的目标图像为背景图像;

p(I′n|θ)为目标图像的似然函数,表示降维特征图像集I′n对应的目标图像为目标图像,满足参数为θ的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(C)表示降维特征图像集I′n对应的目标图像中包含待识别物体的先验概率,p(I′nbg)为背景图像的似然函数,表示降维特征图像集I′n对应的目标图像为背景图像,满足参数为θbg的某一分布的前提下,降维特征图像集I′n的概率密度函数,p(Cbg)表示降维特征图像集I′n对应的目标图像中不包含待识别物体的先验概率;

通过假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征待识别物体特征的降维特征图像,确定出目标图像的似然函数;

p(In|θ)=ΣhHp(In,h|θ)=ΣhHp(In|h,θ)p(h|θ);

其中,h表示假设方法中采用的索引向量,其值域为[1,K],H表示所有h的集合;

通过零假设方法,按照下述公式,挑选出所有降维特征图像集I′n中能够表征背景特征的降维特征图像,确定出背景图像的似然函数;

p(I′nbg)=p(I′n,h0bg)=p(I′n|h0bg)p(h0bg);

其中,h0表示零假设方法中采用的索引向量;

将目标图像的似然函数中的p(I′n|h,θ)变换为下述第一高斯分布函数;

p(In|h,θ)=Πq=1QG(In(hq)|μ,Γ)Πj=1,jhKG(In(j)|μbg,Γbg);

其中,G表示高斯分布,hq表示索引向量h中的第q个特征索引,Q表示索引向量h的长度,即索引向量h中特征索引的数量,I′n(hq)表示根据h从降维特征图像集I′n中选出的第hq个降维特征图像,I′n(j)表示降维特征图像集I′n中未被h选出的降维特征图像,μ,Γ,μbg,Γbg表示第一高斯分布函数的参数;

将背景图像的似然函数中的p(I′n|h0bg)变换为下述第二高斯分布函数;

p(In|h0,θbg)=Πj=1KG(In(j)|μbg,Γbg);

根据所述目标图像的似然函数、背景图像的似然函数、预设贝叶斯学习模型、第一高斯分布函数和第二高斯分布函数,构建下述深度一次性学习模型;

Rp(In|h,θ)p(In|h0,θbg)=Πq=1QG(In(hq)|μ,Γ)G(In(hq)|μbg,Γbg).

通过本发明提供的装置获得的深度一次性学习模型,用其对图像进行识别时,识别率比基于相同少量数据集获取的CNN模型对图像的识别率高,识别效果更佳,适用性更好。

如图4所示,图4示出的是本发明提供的一种采用上述收敛后的深度一次性学习模型进行图像识别的装置的结构框图,该装置400包括:

待识别特征图像集获取模块401,用于将待识别图像输入预设CNN模型,选择该预设CNN模型第n层隐含层的输出图像作为该待识别图像的待识别特征图像集;

第二降维运算模块402,用于采用降维矩阵对所述待识别特征图像集进行降维,生成所述待识别图像的待识别降维特征图像集;

图像识别模块403,用于将所述待识别降维特征图像集输入所述收敛后的深度一次性学习模型中,对待识别图像进行识别,从而确定所述待识别图像中是否包含待识别物体。

采用该装置对图像进行识别时,能够实现采用上述收敛后的深度一次性学习模型进行图像识别的方法中相应的效果,对图像的识别率更高。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号