法律状态公告日
法律状态信息
法律状态
2019-08-13
授权
授权
2016-09-14
实质审查的生效 IPC(主分类):G06K9/62 申请日:20160328
实质审查的生效
2016-08-17
公开
公开
技术领域
本发明涉及一种中值滤波检测方法。特别是涉及一种基于频域波动特征的中值滤波检测方法。
背景技术
数字多媒体信息已成为当今媒体信息制作、处理、传输、存储的主流,数字图像也因其便于处理和编辑的特点而被广泛应用于娱乐、司法、商务、军事和科学等各个领域。随着数码相机、手机和平板电脑等终端的普及,人们可以随时随地获取各类数字图片。然而,新技术的出现,在给人们带来便利的同时,其负面效应也逐渐显现。由于数字信息的易获取和易处理性,一些图像处理技术被用于恶意篡改、伪造图像,破坏了原始图像的真实性和完整性,由此引发的一系列恶性事件也在社会上引起了很大反响。
为了确保数字信息的真实性和完整性,数字图像被动取证技术应运而生。有别于以数字签名和数字水印为代表的主动取证技术,被动取证技术是仅根据获取的数字图像,寻找是否存在篡改后可能留下的各种痕迹,从而区分出自然图像与被篡改图像。由于中值滤波能够在一定程度上掩盖篡改操作留下的痕迹,故常被用做篡改后的反取证处理。所以检测图像是否经历了中值滤波,也能为图像取证提供新的证据。
现存的中值滤波检测算法大都是基于空域特征提出的。Fridrich等人基于图像一阶差分域的联合分布,提出了一种能够抗JPEG压缩的686维SPAM特征。然而随着图像尺寸变小,其性能也大大降低。Yuan等人开发出了一种基于图像直方图统计特性的44维MFF特征,能够减小JPEG压缩和图像尺寸降低带来的影响.Kang等人提出中值滤波残差(MFR)概念,并通过10阶自回归模型系数(AR)或者卷积神经网络(CNNs)构建特征进行分类。
上述算法均能有效地检测中值滤波图像,但是SPAM特征维数太大,计算耗时;MFF特征虽然维数较低,但是构建特征的统计过程繁琐,同样耗时;通过MFR特征分类所使用的自回归模型和卷积神经网络构建过程也较复杂。因此提出一种简洁有效的中值滤波检测算法是非常有必要的。
发明内容
本发明所要解决的技术问题是,提供一种能够在低JPEG压缩因子和小尺寸图像情况下保持较高检测准确率的基于频域波动特征的中值滤波检测方法。
本发明所采用的技术方案是:一种基于频域波动特征的中值滤波检测方法,包括如下步骤:
1)对获取到的原图像进行离散傅里叶变换处理,得到原图像的频域图像;
2)将频域图像进行处理,得到能够反映原图像的频域波动特征的描述点,并将处理后得到的图像划分为N个环形区域,然后分别统计每个环形区域的描述点总个数,即为构建的N维检测特征;
3)将提取的N维检测特征输入支持向量机进行训练,得到支持向量机中值滤波检测器,然后通过支持向量机中值滤波检测器检测原图像是否经历了中值滤波。
步骤1)所述的处理包括:
对经离散傅里叶变换后得到的与原图像同样尺寸的矩阵中的所有复数值z进行取模处理,得到对应的正实数值x,公式如下:
>
其中,z=a+b·i,这里a表示实部,b表示虚部,i是虚数单位。
步骤2)包括:
先将步骤1)经离散傅里叶变换得到的正实数值进行以10为底数的log变换,得到对应的log尺度下的频域图像,并将低频区域转换到图像中心,接下来以log尺度下的频域图像的中心区域像素值的平均值作为当前的阈值,将log尺度下的频域图像中小于阈值的像素值置为1,反之置为0,其中值为1的点即为描述点,然后将log尺度下的频域图像以图像中心为圆心划分成不同直径的同心圆,形成N个环形区域,最后分别统计每个环形区域的描述点总个数,即为构建的N维检测特征,具体公式如下:
>
>
其中AAPn表示提取到的第n维检测特征,
>
其中T是一个基于当前输入尺寸为L×H的log尺度下的频域图像中心尺寸为L/4×H/4的区域w中的各个频点yi,j平均值的自适应阈值,公式如下:
>
最后形成总维数为N的检测特征
AAP=(AAP1,AAP2,...,AAPn)。
步骤3)所述的训练和检测包括:
将获取到的原图像分为训练集和测试集,并提取训练集图像的AAP检测特征,然后输入采用C-SVM分类器的支持向量机,支持向量机的内核为高斯函数:
K(xi,yj)=exp(-γ||xi-yj||2),γ>0
然后通过四层交叉验证在参数网格(C,γ)∈{(2i,2j)i,j∈Z}中,搜索得到最优参数C和γ的值。最后通过训练得到的SVM中值滤波检测器来检测图像是否经历了中值滤波。
本发明的一种基于频域波动特征的中值滤波检测方法,利用图像频域波动特征,更加直观反映经过中值滤波处理的图像和原始图像的差异,能够在保持较低特征维度和算法过程简单的前提下准确地检测出图像是否经过了中值滤波操作,实现高的检测准确率,具有鲁棒性,并且对小尺寸图像和经过JPEG处理的图像仍然保持优秀的检测准确率,同时当待测图像尺寸下降时也能保持良好的检测性能。
附图说明
图1是本发明的基于频域波动特征的中值滤波检测方法的整体流程图;
图2a是本发明中对原图像Lena处理得到的描述点分布图;
图2b是本发明中对原图像Lena中值滤波后的图像处理得到的描述点分布图;
图3a是3×3中值滤波后的图像与原图像的分类结果;
图3b是3×3中值滤波后的图像与5×5均值滤波后的图像的分类结果;
图3c是3×3中值滤波后的图像与delta值为0.5的5×5高斯滤波后的图像的分类结果;
图3d是5×5中值滤波后的图像与原图像的分类结果;
图3e是5×5中值滤波后的图像与5×5均值滤波后的图像的分类结果;
图3f是5×5中值滤波后的图像与delta值为0.5的5×5高斯滤波后的图像的分类结果;
图3g是3×3和5×5中值滤波后的混合图像集与原图像,5×5均值滤波和delta值为0.5的5×5高斯滤波后的混合图像集的分类结果。
具体实施方式
下面结合实施例和附图对本发明的一种基于频域波动特征的中值滤波检测方法做出详细说明。
本发明的一种基于频域波动特征的中值滤波检测方法,如图1所示,包括如下步骤:
1)对获取到的原图像进行离散傅里叶变换(DFT)处理,得到原图像的频域图像;所述的处理包括:
对经离散傅里叶变换后得到的与原图像同样尺寸的矩阵中的所有复数值z进行取模处理,得到对应的正实数值x,公式如下:
>
其中,z=a+b·i,这里a表示实部,b表示虚部,i是虚数单位。
2)将频域图像进行处理,得到能够反映原图像的频域波动特征的描述点,并将处理后得到的图像划分为N个环形区域,然后分别统计每个环形区域的描述点总个数,即为构建的N维检测特征;具体包括:
先将步骤1)经离散傅里叶变换得到的正实数值进行以10为底数的log变换,得到对应的log尺度下的频域图像,并将低频区域转换到图像中心,接下来以log尺度下的频域图像的中心区域像素值的平均值作为当前的阈值,将log尺度下的频域图像中小于阈值的像素值置为1,反之置为0,其中值为1的点即为描述点,如图2a、图2b所示,然后将log尺度下的频域图像以图像中心为圆心划分成不同直径的同心圆,形成N个环形区域,最后分别统计每个环形区域的描述点总个数,即为构建的N维检测特征,并且可以根据需要调整N的大小,具体公式如下:
>
>
其中AAPn表示提取到的第n维检测特征,
>
其中T是一个基于当前输入尺寸为L×H的log尺度下的频域图像中心尺寸为L/4×H/4的区域w中的各个频点yi,j平均值的自适应阈值,公式如下:
>
最后形成总维数为N的检测特征
AAP=(AAP1,AAP2,...,AAPn)。
3)将提取的N维检测特征输入支持向量机进行训练,得到支持向量机中值滤波检测器,然后通过支持向量机中值滤波检测器检测原图像是否经历了中值滤波;具体训练,检测和实验过程包括:
将获取到的原图像分为训练集和测试集,并提取训练集图像的AAP检测特征,然后输入采用C-SVM分类器的支持向量机,支持向量机的内核为高斯函数:
K(xi,yj)=exp(-γ||xi-yj||2),γ>0
然后通过四层交叉验证在参数网格(C,γ)∈{(2i,2j)i,j∈Z}中,搜索得到最优参数C和γ的值。最后提取测试集图像的AAP检测特征,输入到训练好的支持向量机中值滤波检测器中,完成分类识别。
分类性能通过ROC曲线及其线下面积(AUC)来衡量,并且引入最小平均误差Pe的概念:这里的PFP和PFN分别表示虚警概率和漏检概率。
实验过程:
为了节省存储空间,提高传输效率,当下很多图像在篡改过后经常以JPEG格式保存,这也就要求中值滤波检测方法能够对JPEG后压缩保持鲁棒性。本组实验将本发明方法性能与两种现有技术方法MFF以及SPAM(T=3)进行对比,本实验中的检测特征维度N取默认值20。
实验以对从UCID图像数据库获取到的原图像处理为例:
(1)对来自UCID图像数据库的每张原图像中心尺寸为64×64区域中的像素裁剪形成测试数据库BORI。
(2)对测试数据库BORI分别实施5×5均值滤波,3×3和5×5的中值滤波和delta值为0.5的5×5高斯低通滤波操作,依次得到数据集BAVE,BMF3,BMF5和BGAU;
(3)来自于BORI,BAVE,BMF3,BMF5和BGAU这五个数据集的图像经过DFT处理得到对应的频域图像;
其中正例数据集为BMF3和BMF5,负例数据集为BORI,BAVE和BGAU,即
正例:{BMF3,BMF5}
负例:{BORI,BAVE,BGAU};
(4)将上述处理得到的结果作为后续的输入,形成六个不同的训练测试对,分别是BMF3vsBORI,BMF3vsBAVE,BMF3vsBGAU,BMF5vsBORI,BMF5vsBAVE和BMF5vsBGAU;
每一个训练测试对都由正例集合中的一个数据集和负例集合中的一个数据集组成,其中训练数据占50%,测试数据则为剩余的50%,并且训练集和测试集都含有随机数量的正例和负例。
除此之外,再从数据集BMF3和BMF5中各随机抽取总数量的50%作为新的数据集BMF,从数据集BORI,BAVE和BGAU中各随机抽取三分之一作为新的数据集BNMF,由此产生一个新的训练测试对BMFvsBNMF,于是形成了七个训练测试对。每个训练测试对在进行分类识别之前都会进行质量因子(QF)为70的JPEG压缩操作。实验结果如图3a至图3g所示,根据ROC曲线及其线下面积可以看出,本发明方法在各种测试对情况下几乎全部优于其他两种现有技术方法。并且本发明方法的最小平均误差Pe也低于其他两种现有技术方法。这验证了本发明方法的抗JPEG压缩性能优秀。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明设计的技术范围内,可以做出很多变形或替换,这些都应该涵盖在本发明的保护范围之内。
机译: 一种基于频域能量的音频信号检测方法及装置
机译: 基于时域测量的频域检测方法和装置
机译: 有色噪声环境下基于频域信息的端点检测方法