首页> 中国专利> 基于残差域深度学习特征的图像拷贝检测方法

基于残差域深度学习特征的图像拷贝检测方法

摘要

本发明公开了一种基于残差域深度学习特征的图像拷贝检测方法,具体为:提取原始图像和待检测图像的SIFT特征;将两幅图像的SIFT特征进行匹配得到SIFT匹配对;然后将错误的SIFT匹配对过滤,保留其中3对SIFT匹配对,再计算出两幅图像之间的仿射变换矩阵;使用仿射变换矩阵对原始图像进行仿射变换;然后分别计算出变换后原始图像上的重叠区域以及待检测图像上的重叠区域,将两个重叠区域逐像素做差值运算,得到残差图像;将残差图像送入基于多层特征融合的CNN中,从而判断出两幅图像是否为拷贝关系。本发明在保持检测效率的同时,显著地提高了检测精度,且对于视觉上高度相似的拷贝图像和相似图像具有很强的区分能力。

著录项

  • 公开/公告号CN112926598A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 南京信息工程大学;

    申请/专利号CN202110249157.8

  • 申请日2021-03-08

  • 分类号G06K9/46(20060101);G06K9/62(20060101);G06T3/00(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人陆烨

  • 地址 210032 江苏省南京市江北新区宁六路219号

  • 入库时间 2023-06-19 11:19:16

说明书

技术领域

本发明属于数字取证领域。

背景技术

随着计算机网络和多媒体技术的迅速发展,网络上的多媒体信息也呈爆炸式的增长。在多媒体信息中,图像数据是其中最主要的组成部分。然而,多媒体技术的发展在给我们带来便利的同时,也让非法使用者获取图像资源变得越来越容易。非法使用者在未经版权方授权的情况下,肆意复制图片,然后对拷贝副本施以一些诸如裁剪,旋转,缩放等拷贝攻击,以达到自已的使用目的。因此,图像拷贝检测对于版权保护有重大的现实意义。图像拷贝检测任务是给定一对包含原始图像和待检测图像的图像对,判断这组图像之间是否存在拷贝关系,即判断待检测图像是否为原始图像的一个拷贝副本。值得注意的是,图像拷贝检测任务的一个难点在于如何区分拷贝图像和相似图像。拷贝图像和相似图像往往包含相同的物体或者场景,而相似图像是由不同的拍摄角度或者在不同的拍摄条件下获取的,因此一些视角变化或者亮度变化较小的相似图像往往与拷贝图像在视觉上具有较高的相似性,这使得拷贝图像与相似图像难以区分。

在研究的初期,研究者们往往使用手工设计的特征。一般说来,手工设计的特征主要包含特征提取和特征匹配两个步骤。特征提取主要包括全局特征提取和局部特征提取两大类。然后根据设定的度量准则,例如计算特征之间的欧氏距离、汉明距离等,判断两幅图像之间是否存在拷贝关系。然而,由于拷贝攻击种类繁多,因此很难设计一种普适且有效的特征提取方案来提取有区分的特征。且由于常用的度量准则往往是简单地计算特征向量之间的空间距离,导致手工设计的特征难以区分视觉上相似度较高的拷贝图像和相似图像。

最近几年,随着深度学习的发展,神经网络在计算机视觉领域受到了广泛的关注。鉴于这一事实,研究者们开始倾向于将原始图像和待检测图像成对地输入深度神经网络然后直接得到判断输出。由于网络的输入是一对图片,因此研究者们往往选择孪生网络,伪孪生网络或者双信道网络以完成图像拷贝检测任务。之后,一些改进的网络模型被相继提出,例如,孪生CNN网络(Chopra S,Hadsell R and Lecun Y,Learning a similarity metricdiscriminatively,with application to face verification[C],2005IEEE ComputerSociety Conference on Computer Vision and Pattern Recognition(CVPR′05),2005,1:539-546.),伪孪生深度网络(Zheng S,Song Y and Leung T,Improving theRobustness of Deep Neural Networks via Stability Training[C],In Proceedingsof the IEEE Conference on Computer Vision and Pattern Recognition,2016,4480-4488.)和双流双信道网络(Zagoruyko S and Komodakis N,Learning to Compare ImagePatches via Convolutional Neural Networks[J],In Proceedings of the IEEEConference on Computer Vision and Pattern Recognition,2015,4353-4361.)。虽然这些改进的网络取得了可观的检测精度,但是这些网络没有考虑到原始图像和拷贝图像之间的本质联系,即忽视了拷贝检测任务的领域知识,因此难以区分拷贝图像和相似图像。另外,由于CNN本身的设计局限性,即CNN针对几何攻击的抵抗能力往往源自于庞大的训练数据量,这导致网络在训练阶段负担较大,学习效率低下,且检测效果受限。

基于深度学习的图像拷贝检测研究虽然已经取得了很大的成就,但现有的基于深度学习的图像拷贝检测方法主要有以下几个技术难题:

1、现有的基于深度学习的图像拷贝检测方法,往往直接将图像成对地输入网络中,而忽视了拷贝图像和相似图像之间的本质关系,导致网络难以区分视觉相似性较高的拷贝图像和相似图像。

2、现有的基于深度学习的图像拷贝检测方法,往往直接使用CNN提取特征然后将高层的输出送入决策网络进行预测分类,然而拷贝图像之间的区分信息往往很微小,而CNN高层的特征往往表征整体的语义信息,因此CNN的高层特征并不能直接适用于图像拷贝检测任务。

3、现有的基于深度学习的图像拷贝检测方法,往往使用CNN进行特征学习和预测分类,然而由于CNN本身设计的局限性,其针对旋转等几何攻击的抵抗能力主要依赖于庞大的训练数据量。这不仅加重了网络学习的负担,使网络的学习效率低下,而且容易使检测效果受限。

发明内容

发明目的:为了解决上述现有技术中存在的问题,本发明提供了一种基于残差域深度学习特征的图像拷贝检测方法。

技术方案:本发明提供了一种基于残差域深度学习特征的图像拷贝检测方法,具体包括如下步骤:

步骤1:分别提取原始图像I

步骤2:分别计算原始图像I

步骤3:采用RANSAC算法对SIFT匹配对进行过滤,从而筛选出N对SIFT匹配对;

步骤4:基于N对SIFT匹配对,计算原始图像和待检测图像之间的仿射变换矩阵T;

步骤5:采用仿射变换矩阵T对原始图像I

步骤6:分别将待检测图像I

步骤7:若图像库中某个图像与原始图像I

步骤8;将残差图像I

进一步的,所述步骤4中计算仿射变换矩阵T具体为:

步骤4.1:将原始图像I

步骤4.2:原始图像和待检测图像之间的仿射变换为:

其中,(x

进一步的,所述步骤4.2中采用采用SVD算法或最小二乘法求解参数a,b,c,d,e,f。

进一步的,所述步骤6具体为:

将待检测图像I

其中,p

将图像I′

其中,

将图像I′

M

其中,p

将待检测图像I

其中,

进一步的,所述步骤7中的改进后的ResNet18模型包括卷积核大小为3*3的卷积层,第一~四卷积块,第一、二平均池化层,第一、二全连接层,第一、二分类器加权相加模块;所述第一、二分类器的维数为2;

所述卷积层与第一卷积块连接,所述第一卷积块与第二卷积块连接,所述第二卷积卷积块分别连接第三卷积块和第二平均池化层;所述第三卷积块,第四卷积块,第一平均池化层,第一全连接层,第一分类器依次连接,所述第二平均池化层,第二全连接层和第二分类器依次连接;所述第一,二分类器均与加权相加模块连接,所述加权相加模块输出待检测图像与原始图像之间存在拷贝关系的概率。

进一步的,改进后的ResNet18模型的损失函数L为:

L=0.3*L

其中L

基于如下公式计算L

其中y为用于训练改进后的ResNet18模型的残差图像对应的标签值。

有益效果:

(1)本发明采用残差图像作为神经网络的输入,一方面,残差图像能够反映拷贝图像和相似图像的本质区别,所以本发明可以有效地区分拷贝图像和相似图像;另一方面,由于在计算残差图像的过程中减去了两幅图像之间的重叠区域,从而减少了内容的相关性,所以本发明能够避免神经网络学习到无关特征。

(2)本发明采用改进后的ResNet18网络进行训练学习和预测分类。在CNN中,低层的纹理信息和高层的语义信息都能反映拷贝图像和非拷贝图像之间的区别。出于结合CNN多层信息的考虑,本发明结合第二卷积模块的特征和高层特征进行拷贝检测,所以本发明更适用于拷贝检测任务。

(3)本发明采用了SIFT特征进行图像配准,所以本发明能有效地抵抗几何攻击,并且能避免增加不必要的训练数据量。

附图说明

图1是本发明的流程图;

图2是本发明中基于多层特征融合的ResNet18网络结构示意图。

具体实施方式

构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

如图1所示,本实施例提供一种基于残差域深度学习特征的拷贝图像检测方法:在图像预处理阶段,对原始图像和待检测图像提取并匹配SIFT特征,根据正确的SIFT特征匹配对估算两幅图像之间的仿射变换矩阵,利用该仿射变换矩阵将两幅图像进行配准,然后将配准后的图像逐像素相减得到残差图像。在网络学习阶段,将残差图像送入基于多层特征融合的ResNet18网络中进行特征学习和预测分类,根据分类输出,判断两幅图像是否存在拷贝关系。为了提高对于拷贝图像和相似图像的区分能力,本发明在图像预处理阶段通过图像配准然后逐像素相减得到残差图像作为网络的输入,残差图像能反映拷贝图像和相似图像的本质区别,且残差域的计算方式能有效抵抗几何攻击,从而减轻网络的学习负担。同时,在网络学习阶段,为了使ResNet18网络更适用于拷贝检测任务,本发明对ResNet18的网络结构进行了优化,联合考虑了CNN的低层特征和高层特征以区分拷贝图像和非拷贝图像,从而进一步提高拷贝检测的准确率。具体的步骤如下所示:

步骤1:提取原始图像I

步骤2:计算原始图像I

步骤3:所得的SIFT匹配对中包含一些错误匹配,利用RANSAC算法过滤错误的SIFT匹配对:RANSAC算法允许从一组观测值(其中包含一些异常值)精确估计模型参数。为此,RANSAC算法迭代地选择随机观察子集,也称为最小集,以建立模型假设。根据假设与所有观察结果的一致性,对假设进行排序,排名最高的假设将作为最终估计返回。经RANSAC算法过滤后,保留N对正确的SIFT匹配对。

步骤4:为了配准图像以得到残差图像,需要求解两幅图像之间的仿射变换矩阵。若原始图像I

步骤5:将仿射变换矩阵T作用于原始图像I

步骤6:将待检测图像I

步骤6-1:将待检测图像I

其中,p

然后将变换后的原始图像I′

其中,

步骤6-2:类似地,将变换后的图像I′

M

其中,p

然后将待检测图像I

其中,

步骤6-3:两个重叠区域的大小相同;将重叠区域R

其中,p

步骤7:将残差图像I

步骤7-1:优化ResNet18(深度残差网络)的网络结构,使得神经网络融合学习多层特征。理论上,网络的参数量决定了网络的训练速度和学习效率,因此本发明选择ResNet18网络作为基础网络,并对ResNet18网络进行优化,优化后的ResNet18网络的结构如图2所示,在原始的网络中增加了分支。同时为了使ResNet18更适用于图像拷贝检测任务,本发明对ResNet18网络结构进行了优化:首先调整ResNet18的第一层卷积层的卷积核大小,将卷积核的尺寸由原来的7×7调整为3×3,由于较小的卷积核能更好地聚焦微小的细节特征,因此更有利于区分拷贝图像和非拷贝图像;其次,由于图像拷贝检测任务本质上是个二分类问题,即两幅图像若存在拷贝关系则分类为1,若为非拷贝关系则分类为0,因此本发明将全连接层的输出维数置为2;最后,由于CNN的低层纹理特征和高层语义特征都有助于区分拷贝图像和非拷贝图像,因此出于结合CNN多层特征的考虑,本发明修改了ResNet18网络的目标损失函数为:L=0.3*L

步骤7-2:使用训练数据集对网络模型进行训练;随机挑选图像库中70%的图像对用于网络模型的训练,其中,拷贝图像对的标签值为1,非拷贝图像对的标签值为0;网络根据目标损失函数,通过反向传播算法依据梯度方向更新模型参数;待训练完毕后保存所有的模型参数。

步骤7-3:使用测试集对训练好的网络模型进行性能评估。将图像库中剩余的30%的图像对用于网络模型的验证,将这些测试图像对送入训练好的神经网络中进行特征学习和预测分类。

步骤7-4:将待检测图像和原始图像之间的残差图像输入至训练好的ResNet18网络中,ResNet18网络中的第一分类器的输出

步骤8:判断待检测图像是否为原始图像的一个拷贝副本:如果改进后的ResNet18网络输出的概率大于预设的值Th,则认为待检测图像的与原始图像之间存在拷贝关系。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号