1. 引言
与以语言和文字为主的传统交流方式不同,图像是一种直接的、天然的信息表达方式,它不要求信息手中具有特定知识即可完成信息传达,在现今社会中占据重要地位。随着功能强大的图片处理工具,如Photoshop、Microsoft paint等的出现,图像编辑、修改更加容易。数字图像防伪鉴定近年来成为信息安全领域的新兴且极其重要的研究课题,同时是图像媒体内容安全的关键技术。拼接篡改是最常用的图像篡改方式之一,本文主要研究图像拼接篡改的检测方法。
图像篡改检测主要分为两种方法,即主动检测方法和被动检测方法 [1] 。主动检测主要依靠事先在图像中嵌入的数字水印 [2] 和数字签名 [3] 来对图像的真实性进行判断。但是由于这种方法对拍摄图像的设备有特殊要求以及数字水印和签名的脆弱性,并不具有普适性。在大多数情况下,需要被检测的图像都是不含有数字水印或者签名的。这就需要被动检测技术又称盲检测。盲检测是仅依靠图像内容特征来对图像的篡改行为进行检测。
国内外在图像篡改盲检测方面的研究工作集中在两方面:一方面是基于单一特征在篡改前后的变化进行检测鉴定。国外主要研究成果有:利用图像光照不一致性进行检测 [4] ;基于CFA插值模式特征的检测算法 [5] ;基于图像重采样痕迹的检测算法 [6] ;基于DCT域共生矩阵的算法 [7] 。该类方法不需要图像库训练分类器,直接对图像进行鉴定,但有其局限性,准确率偏低。另一方面是基于图像多特征要素加以综合分析,通过在图片库中训练分类其来达到检测篡改的目的。基于希尔伯特–黄变换(HTT)和离散小波变换的特征 [8] ;马尔科夫和统计矩特征 [9] ;基于离散小波变换特征函数和二阶相位不一致性的特征 [10] 。国内的工作主要有图像信息熵和多步马尔科夫特征相结合 [11] ;张震 [12] 和任远 [13] 的基于图像高斯滤波的图像质量评价量(Image quality measures, IQMs) [14] 特征。本文提出了一种新的基于图像小波变换子波带质量参数特征的盲检测模型,在哥伦比亚彩色拼接图像库上达到了93.39%的识别率。
2. 小波变换与图像拼接
小波变换首先要选取母函数,经变换得到各级小波函数,然后将信号分解为小波函数的级数,即得到小波参数 [15] 。本文对图像分级所采用的是可分离正交镜像滤波器,如图1(a)所示(从上倒下依次是0阶、
(a) 多尺度分解示意图
(b) 圆盘小波分解
Figure 1. An example of DWT
图1. 离散小波变换过程示意图
1阶和2阶,从左到右依次是低通、垂直、水平和对角方向),其将图像内容以不同的尺度和方向进行分解。图像沿水平和垂直方向与低通和高通滤波器进行运算,可以得到低通、垂直、水平和对角子带,用
表示尺寸,用A表示子带,V、H、D表示方向,则对应子带可记为Ai、Vi、Hi、Di。以一个圆盘图像的三阶小波分解为例,各子带如图1(b)所示。
3. 特征的选取
3.1. 图像质量评价量的提取
Avcibas研究了图像的客观质量评价量及其统计特性 [16] [17] ,其主要方法是将待检测图像进行一个高斯滤波,然后比较二者在统计特性方面的差异。当使用拼接技术对一副数字图像进行处理后,可认为该图像被引入了一定程度的噪声,即该图像某个区域的图像质量评价量发生了变化。为了得到并表征这种变化,本文将整幅图像进行一阶离散小波变换,然后提取四个子带的图像质量参数作为特征。Avcibas提出了26个图像质量参数,经过筛选、分析和对比,本文选取了对图像拼接操作较为敏感、计算复杂度较低的6个评价量,其计算方法如下:
1) 基于图像之间像素差异的图像质量参数的计算相较于其他质量参数比较简单,而且在某些情况下有不错的表现。因此,这类直观的质量参数也是被最早应用的一类参数。在图像拼接检测中,如果拼接区域和原图像的其它部分内容差异较大,那么这一类质量参数可以很敏感捕获到由拼接带来的边缘信息。该类质量参数有分别表是图像和滤波版本之间像素统计差异的平局绝对误差和均方差的
、
:
(1)
(2)
其中:
表示待检图像中第i行j列像素的第K (RGB图像中K = 1,2,3)通道值。
表示待检图像高斯滤波后第i行j列像素第K通道值,图像大小为
像素,下同。
2) 基于图像和它的滤波版本之间相关性的度量,包括图像保真度度量
和归一化相关度量
:
(3)
(4)
3) 基于图像和它的滤波版本之间谱差异度量,包括基于傅里叶谱幅值差异度量
:
(5)
其中:
4) 基于图像和它的滤波版本之间人眼视觉系统的度量,即归一化均方差
:
(6)
其中:
3.2. 整体模型和特征过程
在提取特征的过程中对每一幅图像进行如下操作:
1) 将彩色图像转化为0~255范围的灰度图像。
2) 将图像进行一阶离散小波变换(这里选取Haar小波函数作为母函数)。
3) 对图像小波变换后得到的四个子带:A、H、D、V分别由(1)~(6)式计算他们的质量参数。
特征提取过程如图2所示:
这样对于每幅图像的四个子带都各有6个质量参数特征,一共是
维特征向量。
4. 实验结果
4.1. 图像库
目前图像篡改检测领域供公开测试的权威样本库是哥伦比亚大学拼接图像库,又独立分为无压缩彩色图像拼接检测哭和灰度图像拼接检测库。彩色库拥有363张图片(图3),其中真实图像有183张,拼接图
![](//html.hanspub.org/file/3-2670150x32_hanspub.png)
Figure 2. The process of features extraction
图2. 特征提取过程示意图
像有180张,图像大小从
到
不等,格式为tiff,由几部不同的相机拍摄,拼接图像的来源可以是同一个相机也可以是不同的相机,且没有平滑处理等后续操作 [18] ,有利于针对拼接进行实验和分析。
为了评测所提取特征检测操作的有效性,将在彩色库上进行试验。将彩色图像库的图像转换为灰度图像。从RGB颜色空间提取亮度信息转换为灰度图像的常用公式如下式所示:
4.2. 分类器的选取
支持向量机(Support Vector Machine, SVM)是一种基于统计学习理论的模式识别方法。本文选用LIBSVM [19] 作为分类器,径向基函数(RBF)作为核函数。对测试图库随机分为六份,其中五份即153张真实图片和150张拼接图片作为训练集,一份即30张真实图片和30张拼接图片作为测试集,进行交叉检验,最后取平均值作为识别结果。训练时用网格搜索方法寻找最佳的c和g参数。分类算法流程如图4所示。
4.3. 实验结果及分析
现在彩色库上进行实验与其他特征进行对比,如彩色质量参数特征 [12] ,小波域统计矩特征 [9] 、小波域马尔科夫特征 [20] ,结果如表1所示。通过对比可知,本文提出的特征具有较高的识别率:93.39%,高于其他特征。还将矩特征,小波域马尔科夫特征和本文特征分别作了受者操作特征曲线(Receiver Operating Characteristic Curve, ROC),如图5所示,比较识别过程的灵敏度和特异度,本文特征显示了最好的综合诊断准确性。
随机从彩色库中选取了五幅图片,分别记录了对于不同特征他们的特征提取时间,还记录了不同特征的模型训练时间,以期比较他们之间的时间复杂度,结果如表2。
从表2可以看出,相较于其他特征本文特征在特征提取和训练上时间复杂度都有明显下降。
5. 结语
本文提出了一种基于图像离散小波变换的图像质量评价量的拼接盲检测模型。该模型首先对图像进行离散小波变换,然后提取一阶变换后的四个子波带作为计算质量参数的原图。通过公式计算出每个子波带的6个质量参数,得到24维特征向量。将特征输入到SVM训练分类器。最后,比较了本文的小波域质量参数特征和其他特征的识别率等指标。结果显示本文在哥伦比亚彩色拼接图像库上的识别率达到
![](//html.hanspub.org/file/3-2670150x36_hanspub.png)
Figure 3. Some examples of splicing images
图3. 彩色图像库中的图片
![](//html.hanspub.org/file/3-2670150x37_hanspub.png)
Figure 4. The process of SVM algorithm
图4. SVM分类算法流程
![](//html.hanspub.org/file/3-2670150x38_hanspub.png)
Figure 5. The ROC curve of the model of this article and others
图5. 彩色库质量参数特征roc曲线
![](Images/Table_Tmp.jpg)
Table 1. Detection rate of IQMs based on DWT and features of other papers
表1. 不同特征在彩色库上的识别率及AUC
注:括号内的数据表示实验数据的标准差。
![](Images/Table_Tmp.jpg)
Table 2. Time consuming on color splicing image data base
表2. 彩色库上特征时间比较
注:括号内的数据表示实验数据的标准差。
了93.39%,高于其它几种特征。并且,小波域质量参数特征相较于其它特征而言,提取特征的时间更短,训练时间也更短。
基金项目
国家自然科学基金联合基金[U1536121];国家自然科学基金[61370195]。
参考文献
NOTES
*通讯作者。