法律状态公告日
法律状态信息
法律状态
2016-11-16
未缴年费专利权终止 IPC(主分类):H04N1/41 授权公告日:20120912 终止日期:20150930 申请日:20090930
专利权的终止
2012-09-12
授权
授权
2010-04-28
实质审查的生效 IPC(主分类):H04N1/41 申请日:20090930
实质审查的生效
2010-03-17
公开
公开
技术领域
本发明属于信号与信息处理技术领域,涉及到检测BMP(bitmap)图像压缩历史的数字图像取证方法。
背景技术
目前主要有两种方法对BMP图像的压缩历史进行检测。一种是基于由JPEG(Joint Photographic Experts Group)压缩所产生的块效应进行BMP图像压缩历史检测的算法。Fan等人在“Identification of bitmap compression history:JPEGdetection and quantizer estimation”中提出一幅BMP图像之前若没有经过JPEG压缩,则块之间的像素值差应该相近,反之像素值差则会因为JPEG压缩的块效应而不同,利用这一特性检测出BMP图像的压缩历史之后还可利用最大相似原理来估计原始量化阶梯。尽管文中的方法得到了一个比较好的检测结果,但是这种方法计算复杂性较大,而且随着压缩质量因数的增大,不能判断BMP图像之前是否经过JPEG压缩的概率变大,尤其当质量因数大于95后,由于块效应不明显导致算法检测准确率急剧下降。另一种典型方法是基于Benford法则的检测方法。2007年,Fu等人通过大量实验发现单次压缩的JPEG图像的JPEG系数的第一位有效数字符合广义Benford法则分布。Benford法则是经济学中常用的一个公式。Fu等人在“A generalized Benford’s law for JPEG coefficients and itsapplications in image forensics”一文中利用JPEG系数首位有效数字的这一分布特性通过SVM(Support Vector Machine)分类器进行分类可以检测BMP图像之前是否经过JPEG压缩,并粗略估计原始压缩质量因数。文中实验结果表明此方法在原始压缩质量因数高达99时,检测准确率仍能达到100%。但是Benford法则的应用有很多限制条件,如数据不能设置最大值与最小值的限制,数值在一个很宽的范围里连续变动,既不完全随机,也不过度地集中等。因此虽然此种方法在文献的实验中达到了很高的准确率,但是这些限制条件使得这一方法的使用有一定的局限性,如色调单一图像如大片蓝天、绿地等图像并不符合这一规律,图像尺寸较小时也会有影响。
发明内容
本发明要解决的技术问题是提供一种对单幅或大批BMP图像进行JPEG压缩历史检测的方法。
本发明的技术方案如下:
1.JPEG压缩对图像JPEG系数的影响
图像经过分块DCT(Discrete Cosine Transform)变换和量化之后的DCT系数称为JPEG系数,它可以从JPEG图像文件中直接读取。JPEG系数中0的个数是影响JPEG压缩质量的一个主要因素。通过实验发现,若将同一幅BMP图像压缩为不同质量因数的JPEG图像,随着JPEG压缩质量因数的增大,图像质量随之不断变好,64个JPEG系数中0的百分比也会随之不断减小。
因此将0的在64个DCT位置上的个数百分比定义为图像经过JPEG压缩后的信息损失量,则图像信息损失量越大,JPEG图像质量越差。设n(j)为所有DCT块中第j个JPEG系数位置上0的个数和,m为8*8DCT块的个数,则图像信息损失量可表示为
平均信息损失量表示为
图1中显示了任取一幅BMP图像将其压缩为质量因数Q=75~100的JPEG图像后计算平均信息损失量average的结果,可见随着Q的增大,average不断减小。
因此,将一幅待测BMP图像Ibmp压缩为Q=100的JPEG图像Ijpeg1,若Ibmp之前经过质量因数为Q1(Q1<100)的JPEG压缩,则图像信息损失量会大于一幅原始BMP图像直接转换为Q=100的JPEG图像的图像信息损失量。只要通过比较待测BMP图像与原始BMP的图像信息损失量,便可判断出待测BMP图像之前是否经过JPEG压缩。因为JPEG压缩是有损压缩,我们无法从一幅之前经过JPEG压缩的图像中恢复到之前的原始图像,因此申请人采用了对待测图像剪切4行4列的方法估计原始BMP图像。
2.剪切4行4列估计原始图像
一幅JPEG图像剪切四行四列后可以看做是校准后的图像,如图2所示。因为将一幅图像剪切4行4列后,图像信息损失量不大,若图像之前经过JPEG压缩,对其剪切4行4列后,会破坏原JPEG压缩的8*8分块结构,再次进行JPEG压缩之后,则仅只有最后一次压缩可见。
将一幅待测BMP图像剪切4行4列,则若图像之前经过JPEG压缩,剪切之后会破坏原来的压缩效应,可近似看做一幅原来未经过JPEG压缩的原始图像;若图像之前未经过JPEG压缩,则即使经过4行4列的剪切操作,因为图像信息损失量不大,仍可看做一幅原始图像。
因此本发明通过对待测图像剪切四行四列来近似估计原始图像,并通过与待测图像的信息损失量比较来提取待测图像的统计特征进行BMP图像压缩历史检测。
3.反映图像信息损失量的特征提取
根据JPEG压缩对图像JPEG系数的影响,本发明提取了待测BMP图像和估计原图压缩为Q=100的JPEG图像后的JPEG系数统计特征来进行BMP图像压缩历史检测。
将一幅由相机摄取的TIFF(Tagged Image File Format)图像压缩为质量因数为90的JPEG图像后,再重新读取并解压缩为一幅BMP图像,如图3所示,从视觉角度看无法感觉到它与原始TIFF图像之间的差异,但是通过分别提取二者的64维p(j)特征之后,可发现同一DCT系数位置上0的个数百分比有很大差别,原TIFF图像64个位置上JPEG系数中0的比重均远小于之前经过JPEG压缩的BMP图像,如图4所示。
因此本发明利用这一现象,假设给定一幅待测BMP图像Ibmp,对其剪切四行四列后得到估计原图Iest,分别将这两幅图像压缩为Q=100的JPEG图像Ijpeg1和Ijpeg2,通过分别读取这两幅JPEG图像的Y通道的JPEG系数,按照公式1计算得到pI1(j)和PI2(j),j=1,2,...,64,即64个DCT系数位置上的图像信息损失量。令
Z1=NUM(pI1(j)>pI2(j)),Z2=NUM(pI1(j)<pI2(j))
其中NUM(·)为求个数函数。
从而得到2维特征Z1和Z2,作为图像信息损失量增减少的度量。若待测BMP图像Ibmp之前未经过JPEG压缩,则图像Iest与Ibmp的图像信息损失量应该近似,表现为Z1≈Z2;若Ibmp之前经过JPEG压缩,则因为JPEG压缩是有损压缩,即使解压缩为BMP图像,还是会损失一些细节,所以再将其压缩为质量因数为100的JPEG图像之后,图像信息损失量增大,导致Iest中某些位置上的图像信息损失量会增大,因此,所求的2维特征会表现为Z1>>Z2。
综上所述,本发明对BMP图像压缩历史检测的具体步骤如下:
要检测一幅BMP图像Ibmp之前是否经过JPEG压缩,首先要将其剪切4行4列后得到一幅估计原图Iest,再分别将这两幅图像压缩为Q=100的JPEG图像Ijpeg1和Ijpeg2,利用它们的JPEG系数中图像信息损失量进行特征提取,最后可利用Fisher线性分类器进行分类训练和测试检测BMP图像的压缩历史,也可利用提取特征的比例关系进行阈值分割,无需训练和测试就可对单幅图像进行判断。
本发明的具体实现步骤如图5所示。
本发明的效果益处是:数字图像作为司法证据,最重要的就是要判断其是否经过篡改。通过判断一幅BMP图像之前是否经过JPEG压缩,可以对图像的真实性做出初步的判别,为司法部门的证据监督链提供有效的技术保障。本发明适用于信息安全领域,可以有效地对一幅给定的BMP图像进行压缩历史的检测。
附图说明
图1是图像平均信息损失量average随JPEG压缩质量因数的变化图。
图中:横坐标是75-100的质量因数,纵坐标是average的值。
图2是原图估计方法即校准图像的获取方法图。
图3是原始TIFF图像与原来经过Q=90的JPEG压缩的BMP图像的视觉对比图。
图中:(a)为原始TIFF图像,(b)为原来经过Q=90的JPEG压缩的BMP图像。
图4是64个DCT位置上JPEG系数中0的比重图。
图中:十字线条为原始压缩质量因数为90的bmp图像经过Q=100的压缩后JPEG系数中0的比重,方块线条为原始TIFF图像。
图5是本发明方法的整体实现步骤示意图。
具体实施方式
以下结合技术方案和附图,详细叙述本发明的具体实施方式。
实验中选择了由Kodak DC290相机摄取的300幅TIFF图像作为原始的无损图像,包含两种分辨率,分别为720*480和1440*960,并将这300幅TIFF原图分别压缩为Q={60,70,80,85,90,95,96,97,98,99}的JPEG图像后再转成BMP图像,作为原先经过JPEG压缩的BMP图像。因为随着压缩质量因数Q的减小,图像损失信息越多,图像质量也会越差,从理论上讲,算法的检测效果也会越好,所以,本发明选择了3个较低的常用压缩质量因数Q={60,70,80,85}用来测试算法的有效性,选择了最大到99的6个较高的压缩质量因数Q={90,95,96,97,98,99}。这样总共得到了300*10=3000幅图像。
利用提取的2维JPEG系数特征,考虑到特征维数少,实验中使用fisher线性分类器,300幅图像中200幅用来训练,100幅用来测试,对原始TIFF图像与原先经过质量因数分别为Q={60,70,80,85,90,95,96,97,98,99}的JPEG压缩的BMP图像进行一对一的分类测试。测试结果如表1所示。
表1本发明一对一实验结果
本发明所提出的方法即使在原始压缩质量因数Q高达98时,仍能100%准确分类,因为Q=99时,JPEG压缩损失信息较少,检测较为困难,但是准确率也达到了95%。在实际情况中,原先压缩的质量因数是未知的,因此我们对本方法进行了混测实验,即从原始压缩质量因数为Q={60,70,80,85,90,95,96,97,98,99}的BMP图像中分别选取20幅不同的图像组成200幅训练图像,再从剩下的100幅图像中每种质量因数分别选取10幅图像组成测试集,原TIFF图像选择200幅作为训练,100幅作为测试,利用fisher线性分类器进行分类,则原始BMP图像分类准确率为100%,而之前经过压缩的BMP图像分类准确率较低,为92%,考虑原因是训练和测试图像中Q=99的图像较多,而实际应用中之前压缩质量因数Q=99的图像所占比例很小,因此去除Q=99之后的混测模型准确率均达到了100%。
选择5幅蓝天,绿地的原始图像,利用本发明的混测模型进行测试,5幅图像全部准确判断为原始图像。
另外,通过实验发现,原始图像与之前经过JPEG压缩的BMP图像的特征Z1与Z2的比例有较大差别,因此,可以考虑无须训练,用阈值分割方法来判断图像之前是否经过JPEG压缩。设
表2300幅图像的Z值计算结果
表中列出了300幅原始图像和之前经过不同质量因数压缩的BMP图像的Z值的最大值和最小值,其中Inf表示无穷大,说明Z2=0。Q=99时Z<2.0的图像300幅中仅有35幅,Q=98时Z<2.0的图像300幅中仅有2幅,原图中Z>2.0的图像300幅中仅有2幅。因此,可将2.0作为区分原始图像与原先经过压缩的BMP图像的一个阈值,给定一幅BMP图像,只需计算其Z值,便可初步判断它原先是否经过JPEG压缩。
分别计算蓝天、草地的原始图像和这5幅原始图像压缩为Q={85,95,99}的JPEG图像再解压缩为BMP图像后得Z值结果如表3所示。
表35幅蓝天、绿地图像Z值结果
可见原始图像的Z值均在阈值2.0以下,而之前经过JPEG压缩的BMP图像即使是原始压缩质量因数高达99时,仍在阈值2.0以上,因此本发明对大片单一色调图像仍然适用。
机译: 存储用户对包装内容的使用历史的偏好信息管理设备,计算该使用历史的分数,并将计算结果作为偏好信息输出,以及存储用户对包装内容和其他内容的用户历史的偏好信息管理设备,并以这样一种方式计算使用历史记录的分数,即认为打包内容的使用历史记录比其他内容的使用历史记录更有价值,并输出计算结果作为偏好信息
机译: 一种用于估计金属构件壁损失量的装置及使用该装置估计金属构件的壁损失量的方法。
机译: 一种将具有基于图像组的图像压缩的数字音频和/或视频程序存储在具有立即跳转的介质上的方法