1. 引言
随着网络技术的不断发展,数字化的出版方式由于其简便、出版成本相较于传统出版方式的成本更低的特点受到大众的青睐。但是在信息资源传播和共享模式的不断发展中,没有得到作品拥有者许可的用户对作品进行非法传播与拷贝的侵权行为时有发生 [1] [2]。随着保护数字作品版权意识不断地深入,能够实现秘密传输的信息隐藏技术开始成为版权保护方案中的协助技术之一。
信息隐藏技术主要利用多媒体信息的冗余性和人类感觉器官的不敏感性这两个特点,将要传输的秘密信息隐藏在公开传输的载体信号中并且使得隐藏的信息无法被人察觉。自从信息隐藏技术被应用于数字图像,许多相关的嵌入算法被提了出来。例如 [3] [4] 中介绍的LSB算法是信息隐藏技术中的经典方法,这种方法简单易实现但是鲁棒性差。 [5] [6] 中提出的方法是改进后的LSB算法,这种方法能够克服LSB算法引起的值对现象从而提高安全性。相较于上述提出的算法, [7] [8] 中的信息隐藏算法具有更高的可靠性与安全性。然而在某些场景下我们希望能够在将秘密信息提取后能够无损地恢复原始载体数据。2006年,Ni [6] 等人提出的基于直方图平移的可逆信息隐藏算法能够无损地恢复出载体信号, [9] [10] [11] 中提出的可逆方法还能够一定程度上提高载体信号的嵌入容量。
随着信息隐藏技术的发展,利用信息隐藏技术来达到版权保护的目的已经成为了保护多媒体信息版权的重要方法之一。1993年,Tirkel [12] 等人第一次提出“数字水印”概念,并通过替换灰度图像的最低有效位来嵌入水印。Cox [13] [14]、Chen [15]、Nikolaidis [16] [17] 针对数字图像提出了鲁棒性、嵌入率更高的数字水印算法。随着针对于数字图像的水印技术的发展,音频、文本、视频水印也逐渐得到了发展。1994年Matsui [18] 将视频的每一帧作为图像后提出了一种视频水印算法。随后,Boney [19] 在Bender [20] 提出的回声编码、相位编码等算法的基础上得到了音频信号中的水印算法。Maxemchuk [21] 为了保护电子出版物的版权,首先提出在数字文档中嵌入水印,并获得了很好的实验结果。随后数字水印的快速发展使得其成为了数字作品版权保护的主力军。
本文利用信息隐藏技术提出了一种新的保护版权的方法。首先从原始图像中选取一部分像素点组成缩略图,将缩略图作为接下来信息隐藏的载体图像。然后将剩余像素点的DCT系数经过压缩、编码、加密后作为秘密信息嵌入载体图像中。最后将载密的缩略图在信道中进行传输。这样的方法我们能让只有获取了数字作品所有者许可的用户能够得到高清图像,而其他用户只能获得分辨率不高的缩略图从而保护了作者的版权。
2. 新型版权保护设计方案
版权保护算法框图
本文所提出方案的框架如图1所示,该方案大致可以分为三个阶段:1) 图像预处理阶段,2) 数据隐藏阶段,3) 数据提取和图像重建。在图像预处理阶段,数字图像所有者可以从原始图像中选取像素组成信息图像而剩余的像素点则构成原始图像的缩略图。在进入数据隐藏阶段前,先对信息图像的DCT系数压缩后得到的数据和相关参数进行无损编码。在数据隐藏阶段,首先使用加密密钥对编码得到的二进制码流进行加密,然后使用数据隐藏算法将加密后的数据嵌入到原始图像的缩略图中从而生成含有加密数据的秘密图像。在数据提取和图像重建阶段,接收方将提取出隐藏在缩略图中的信息后根据密钥进行解密,再将解密得到的数据结合被提取信息后的秘密图像可以对原始图像进行重建。
![](//html.hanspub.org/file/7-2670284x7_hanspub.png?20220726093710486)
Figure 1. Design block diagram of new image protection scheme
图1. 新型图像保护方案设计框图
2.2. 图像预处理
原始图像直接在信道中传输会占用较大带宽,因此我们选取原始图像中的一部分构成缩略图。在通信的过程中,将缩略图像在信道中进行传输。假设图像大小G为
没有经历过压缩。为了后续的操作,我们选择在图像的每行中每隔
个像素点选取一个像素点,并且把选中的像素点称为信息像素点,没有被选中的像素点称为剩余像素点。由剩余像素点构成的图像即为要在信道中进行传输的缩略图
,由信息像素点构成的图像称之为信息图像
。缩略图像、信息图像与原始图像的关系如下:
(1)
我们把n称作压缩指数,n越大图像压缩程度越小反之越大。
是缩略图中任意一点的像素值:
(2)
是信息图像中任意一点的像素值:
(3)
其中
,
。
floor(.)操作是向负无穷的方向取整,mod(.)操作是对数字进行取余。图像预处理后得到的信息图像及缩略图如图2所示,得到原始图像G的缩略图R后将其用作嵌入数据的载体图像。
![](//html.hanspub.org/file/7-2670284x23_hanspub.png?20220726093710486)
Figure 2.The original images and thumbnail images
图2. 原始图像及其对应的缩略图像
3. 数据处理
3.1. DCT变换与量化
为了能够从接收到的缩略图像中恢复原图像,我们必须把信息图像的相关数据嵌入缩略图像中。与 [21] 中的方案不同,本文选择将信息图像的DCT系数作为秘密数据。首先将图像分成不重叠的8 × 8的小块,然后根据公式(6)对每一个小块进行DCT变换。为了减少待嵌入的信息量,我们对得到的DCT系数进行了量化。在量化过程应该注意由于选择的像素点大多数不是相邻像素点因此得到的高频信息会较多而本文对于DCT系数进行量化的目的是希望能够减少一部分高频信息来降低所要嵌入的信息量同时不会造成较大的失真。如果选用DCT标准亮度量化表进行量化会将所有高频信息丢弃从而造成较大的失真。
为了避免所有高频信息被丢弃,本文提出了一种能够选择保留信息量的量化方法。在提出的量化方案中选择先对DCT系数进行直方图统计,再根据直方图选择合适的值作为阈值W并根据下式将阈值W作为筛选DCT系数的标准。在筛选DCT系数的过程中,阈值的选择与所要保留的信息量有关,阈值越小保留信息越多失真度越小。
为任一DCT系数,
为经过处理后的DCT系数。
(4)
3.2. 数据压缩与编码
尽可能上述量化操作只是将部分高频信息丢弃并没有对保留下来的DCT系数进行处理。这样就导致DCT系数中存在绝对值较大的系数,这些数值较大的系数在后续的编码中需要占用较多的比特。在后续对DCT系数的区间进行编码时我们希望区间索引值属于[0, 255],因此为了满足这一条件我们选择先利用缩放指数e (
)对保留的系数进行缩放来解决这个问题(如式(5)所示)。由于要求缩放后的DCT系数之间的最大差值不超过256,所以在选择e时不能过大否则易超出256从而无法只用8个比特位表示DCT系数,过小的e在对DCT进行取整操作后精确度降低会对恢复后的图像造成一定的失真。
(5)
其中
代表的是经过筛选后的DCT系数进行缩放等操作后得到的结果。
为了在对最终得到的DCT系数进行编码的同时实现数据压缩的目的,我们不对DCT系数直接进行编码而是先对DCT系数进行分段后再对DCT系数落入的区间索引进行编码。具体的操作步骤如下:
· Step 1:将DCT系数分为K段,每一段只包含一个DCT系数。
(6)
· Step 2:完成分段后,用每个DCT系数对应的区间索引来代替DCT系数。
表示的是任一DCT系数对应的区间索引,其中
。
(7)
· Step 3:获得每个DCT系数对应的区间索引后,选择采用无损编码的方式(如哈夫曼编码,算术编码)对其进行编码。
3.3. 数据嵌入
由于我们所用到的载体图像为原图像的缩略图,这样的载体图像依然具有意义,那么现有的信息隐藏算法都是可以采用的。在对秘密信息MS (MS由区间索引编码得到的二进制码流、
、
、e、n构成)进行加密后我们从缩略图中选择T个(
)低位平面用于信息嵌入。LS表示秘密信息SM (由MS经过公式加密后得到的)的比特流长度。当
时,将T个低位平面的数据依次用秘密信息进行替换。当
时,将秘密信息SM中
位如上述操作嵌入缩略图像的T个低位平面中,剩下
位则嵌入在(
)高位平面中。考虑到直接将高位平面进行数据替换会造成比较大的失真,因此在对高位平面进行数据嵌入时我们选择采用可逆信息隐藏算法。这样在提取信息后高位平面能够无损的恢复。完成上述操作后就能够获得如图3所示的含有嵌入信息的载密图像SR。其中
代表信息隐藏密钥。
(8)
![](//html.hanspub.org/file/7-2670284x44_hanspub.png?20220726093710486)
Figure 3. Thumbnail image embedded with secret data
图3. 嵌入秘密数据的缩略图像
4. 信息恢复与图像重建
4.1. 信息恢复
当接收方接收到图像SR后,若缩略图像只在T个低位平面嵌入了信息,直接按照次序从T个位平面中提取信息,否则需要先从高位平面中提取信息再从低位平面中进行信息提取,这样才能够将所有嵌入信息完整的提取出来。由于在高位平面进行信息嵌入的时候我们采用的是可逆信息隐藏方式,所以在提取完高位平面的信息后也能够无损的恢复高位平面。在信息提取阶段,应该考虑两种情况:接收者有数据隐藏密钥和接收者没有密钥。没有权限的接收者无法将秘密图像SR中提取的数据进行解密而具有数据隐藏密钥的接收者可以通过以下过程获得解密数据。
如果秘密信息只嵌入在缩略图像T个低位平面中,则接收者直接从图像SR的T个最低位平面中提取数据同时不对图像SR (
)个高位平面的数据进行操作,因为它们在数据隐藏过程中没有改变。当秘密信息不仅存在于T个低位平面中时,接收者应当先从这T个低位平面中提取嵌入的数据再从(
)个高位平面中提取出嵌入信息。由于在高位平面进行信息嵌入的时候采用的是可逆信息隐藏方式,所以在提取完高位平面的信息后也能够无损的恢复高位平面。
没有解密权限的接收方只能将信息从载密图像中提取出来但是无法恢复加密信息;拥有解密权限的接收方能够获得解密密钥并对通过以下公式将提取出来的信息进行解密,从而恢复信息。
(9)
4.2. 图像重建
得到解密后的信息后,我们能够将嵌入图像中的信息像素点的DCT系数恢复。然后对恢复的DCT系数进行反变换后可以得到信息像素点的像素值。信息像素点以及被提取信息后的图像SR (即图像SR')根据以下公式可以重建原始图像同时由图4展示重建后的图像。
(10)
其中
,
。
5. 仿真实验
使用图2所示的四张大小为512 × 512 的图像即Lena、Baboon、Peppers和Barbara作为原始图像。当把间隔参数n设置为4时可以得到大小为512 × 384的缩略图以及大小为512 × 128的信息图像。根据DCT系数的统计直方图将阈值W分别赋值为1、10、5和5,并设置缩放指数e为0.1后,能够生成信息图像中像素点DCT系数的压缩数据。对缩略图像完成嵌入操作后可以得到图3中所示的载密图像。
从载密图像中重构原始图像后,可以获得与原始图像相差不大的图像同时重建图像的峰值信噪比(PSNR)值分别为46 dB、41 dB、46 dB和45 dB (见图4)。间隔参数n代表图像的压缩率,理论上n越大则需要嵌入缩略图中的信息量就越少恢复图像的质量会更好,因此参数n是影响重建图像质量的因素之一。除此之外,阈值W的大小在一定程度上也对恢复图像质量有影响。为了了解这两个因素对重建图像质量的影响程度,本文通过以下实验对这两个指数进行了验证。
我们通过对n、W设置不同的值时得到的重建图像的PSNR、秘密信息长度(LS)以及运行时间进行了研究,并将实验得到的结果展示在下表1~4中。从实验数据中可以得出,间隔像素点n越大重建图像的PSNR越高,图像恢复质量越好。这是因为n越大时选取的像素点越少,需要嵌入的信息量减少而保留的像素点信息越多所以重建后的图像质量高。与此同时,实验数据表明阈值W的选取也会影响恢复图像的质量。由于阈值W是根据DCT系数的统计直方图来进行选择的,阈值W若大于DCT系数分布最多的区间则作为需要嵌入的信息量减少从而会造成图像恢复质量降低,反之被保留作为信息嵌入的信息量虽然增大但是提高了恢复图像的质量。
我们使用的原始图像Lena,它的DCT系数中最大阈值不能超过900,否则如表所示,当阈值为1000,重建图像的PSNR仅为24 dB。当W小于最大阈值时W的增加虽然会导致PSNR的下降,但总体来说恢复的图像仍然具有高质量。
![](Images/Table_Tmp.jpg)
Table 1. Reconstruction performance when using Lena as original image
表1. 使用Lena作为原始图像时的重建性能
![](Images/Table_Tmp.jpg)
Table 2. Reconstruction performance when using Baboon as original image
表2. 使用Baboon作为原始图像时的重建性能
![](Images/Table_Tmp.jpg)
Table 3. Reconstruction performance when using Peppers as original image
表3. 使用Peppers作为原始图像时的重建性能
![](Images/Table_Tmp.jpg)
Table 4. Reconstruction performance when using Barbara as original image
表4. 使用Barbara作为原始图像时的重建性能
性能比较
在图像质量、运行时间和压缩效果方面,本文提出方法的性能与 [21] 中的方法进行了比较。与本文不同的是, [21] 中使用最近邻插值方法来选择像素形成原始图像的缩略图,并计算剩余像素点像素值的估计误差。考虑到嵌入容量, [21] 中也选择利用区间表示法来压缩数据并且用每个区间的中值来代替剩余像素点的像素值。在该方案中通过迭代计算表示估计误差所需的数据量与失真率之间的比率来确定最佳分割方法。从表5的数据可以得出结论,与本文的方法相比,这种方法并没有取得更好的压缩性能,反而增加了复杂度。这是因为在本文中使用区间表示压缩数据之前,通过量化对数据进行了第一次压缩并简化了确定分割的方法。除此之外,在 [21] 的方案中利用区间中值代替像素值的方法在重建原始图像时引入了一定程度的失真。这也是为什么当原始图像的缩放比例与其他先决条件相同时,本文的方法可以获得更好质量的重建图像。(由于参数n的取值直接影响缩略图的大小,因此选用参数r来表示缩略图相对于原始图像的缩放程度。)
![](Images/Table_Tmp.jpg)
Table 5. The performance comparison between the proposed scheme and the scheme in [21]
表5. 将本文方案与 [21] 中的方案进行性能比较
6. 总结
本文通过信息隐藏技术提出了一种新型的保护版权的方案。在方案中我们通过原始图像的缩略图作为载体图像,将剩余像素点的DCT系数通过压缩,编码和加密后作为信息嵌入载体图像中,最后将含密的载体图像在公开信道中传输。获得作品所有者许可的接收方能够在预览图像后根据密钥恢复出与原始图像相差不大的图像,否则只能够得到分辨率较低的缩略图像。这样的方法既能减小图像在传输时占用的带宽,也能够给用户预览图像的功能同时保护数字图像不被非法者滥用。
基金项目
本研究得到上海市国家自然科学基金(20ZR1400700)、上海市科技重大专项(2019SHZDZX01)、国家自然科学基金(61772129)和先进光通信系统与网络国家重点实验室(批准号2020GZKF002)的支持。