基于图像的掩密分析技术及其应用

发布时间:2004-08-02 作者:石鹏 高明 阅读量:

    掩密技术是一门秘密通信技术,其目的在于隐藏信息的存在,而不是像密码学那样仅隐藏信息的内容。数字图像、视频文件、声音文件以及其他计算机文件中包含大量人体感觉不到的冗余信息,可用作传递秘密信息的载体。将信息嵌入这些载体中就形成了人们视觉、听觉以及其他感观所难以检测到的实体。
    如同密码分析试图破解密码一样,掩密分析以破坏掩密为目的,它是一门检测隐匿信息存在的技术,包括对隐匿信息的检测、提取和破坏。掩密分析技术是信息隐藏领域的研究难点和重点。

1 掩密技术
    掩密系统的结构如图1所示。


    掩密技术可应用于多个领域,如:图像技术、音频技术、视频技术、文本通信等领域,目前信息隐藏技术正逐渐走向成熟。在基于图像的信息掩密技术中,有两种掩密技术:基于时空域的掩密技术和基于频率域的掩密技术。基于时空域的掩密技术相对简单,通常采用最小有效位(LSB)嵌入的方法;基于频率域的掩密技术首先把载体变换到频率域,将信息隐藏在频率域的系数中。通常采用的频率域方法有:傅立叶变换、离散余弦变换(DCT)、小波变换等。对于掩密技术,有两个重要的衡量指标,即隐秘性和鲁棒性。
    通常在载体中嵌入一定数量的消息应该不会给原始载体带来可感知的降质,但是,随着嵌入信息的增加,载体的降质会逐渐明显起来。对嵌入的信息应要求具有一定的鲁棒性,能够抵抗载体的多种变换操作,而不破坏隐藏的信息。掩密技术的发展可以分为4代:
    第1代掩密技术基于固定模式的掩密技术,主要采用了连续、随机、加密的LSB嵌入算法,或者通过变换域:如离散傅立叶变换(DFT)、离散余弦变换、离散小波变换(DWT);第2代掩密技术采用视觉处理,基于可感知模型,但它会带来其他方面的异常;第3代掩密技术基于视觉处理和统计保持的隐藏方法,它对于图像直方图能保持,但对高阶统计量不能保持;第4代掩密技术具有第3代掩密技术的大部分属性,但第4代掩密技术并不采用时空域和频率域中嵌入消息位来替换载体图像的噪声,而是在视觉和统计的约束中改变图像的属性。
    目前随着信息掩密技术的发展,掩密信息的检测变得越来越困难。

2 掩密分析技术
    掩密分析技术是伴随着信息掩密技术而产生的,它是对信息掩密的攻击技术。这很类似于加密技术与密码分析技术的关系。掩密分析技术主要是为了检测隐秘信息的存在或破坏隐秘的通信。
掩密分析技术可分为3种:
(1)攻击。对隐秘载体的破坏,以使信息无法被提取。
(2)检测。判断隐藏信息是否存在。
(3)破解。截取隐秘载体后,分析出隐藏的信息。
    基于图像的信息掩密检测技术可以分为两种:

(1)时空域方法。主要用于检测基于时空域嵌入方法的信息隐藏,如:LSB嵌入方法。时空域方法实现简单,但检测能力有限。

(2)频率域方法。对于嵌入信息的数字图像,在频域呈现出与原始图像不同的特性,利用这种特性可以检测是否存在信息嵌入。常用的频域方法有:傅立叶变换、拉普拉斯变换、离散余弦变换和小波变换等方法。
    掩密分析的方法有很多,根据获取的对像素进行分类,大致有4种:已知载体分析、已知消息分析、选择消息分析、已知隐藏分析。
    类似于网络安全中的入侵检测系统,基于图像的信息隐藏检测系统的检测方法有两种:

(1)基于签名的检测方法
    针对已知的隐藏算法和工具,研究其特征,从而判定是否存在该算法或工具实现的信息隐藏。该方法的优点是检测准确性高,可以分辨嵌入的算法和工具,缺点是无法检测未知的隐藏算法和工具。

(2)基于统计的检测方法
    在信息嵌入到数字图像中后,改变数字图像的统计特性,根据统计的偏离判定是否存在信息隐藏。该算法的优点在于寻求某类图像或算法的检测方法,而不是针对于某个工具、算法,具有较强的检测能力,缺点是检测准确性受外界因素影响大,无法分辨是哪一种隐藏工具和算法。
常用的检测线索有:

  • 图像中是否有扩大的噪声
  • 图像是否有扩大的图像填充
  • 是否存在非正常的调色版项,如过多的黑色项

    衡量基于图像的信息隐藏检测系统的技术指标包括检测速度和检测的准确性。

3  掩密分析技术在基于LSB图像掩密算法中的应用
    掩密技术广泛应用于数字图像中,因而针对数字图像的掩密分析成为研究的热点和重点。在现有为数不多的分析方法中主要有可视攻击和统计攻击两类。

3.1 可视攻击
    所谓的可视攻击[1]是指滤除掩盖秘密信息的所有图像部分,人眼可直观地判断是隐匿信息还是原图像内容。滤除过程如图2所示:


    多数信息掩密算法要么以顺序的要么以某种伪随机的方式嵌入消息比特。在大多数程序中,非适应地选择与图像内容无关的消息比特,如果图像中含有单一颜色相连的区域或者以颜色值0或255来填充的相连的区域,那么就能够在预先处理(如对图像中的调色板进行排序,然后根据LSB替换值进行黑白着色,最后恢复原有的调色板顺序)含有隐匿信息的图像后使用简单的可视检测来找寻所隐匿的信息。即使不能够轻易看到图像是否隐匿信息,我们也可构造一个比特平面(比如析取图像的LSB平面)仅仅检测比特平面本身。可视攻击特别适用于调色板图像。

3.2 统计检测
    大多数信息掩密算法都不十分安全,往往留下这样或者那样的可识别的指纹。尽管它们不被人所感觉,但是通过完全的统计分析仍然能够显现图像中的异常。下面介绍几种非常有效的统计检测方法。

3.2.1  统计直方图检测
    图像的灰度统计直方图是1个一维的离散函数:p (sk )=nk /n。
函数中,sk为图像的像素素的第k级灰度值,nk是图像中具有灰度值sk的像素素的个数,n是图像像素素总数。因为p(sk)给出了对sk出现概率的1个估计,所以直方图提供了图像的灰度值分布情况,也可以说给出了一幅图所有的灰度值的整体描述。因此利用直方图的这种性质可以建立起各种检测方案,其中比较有效的是对值(PoV)统计分析检测和基于差异图像直方图(DIH)的检测。

(1)PoV统计分析
    文献[1]给出了利用一组固定的PoV彼此相互对应的特性来嵌入秘密信息的掩密算法,提出了一种强有力的统计攻击。由像素素值、量化DCT系数或LSB中不同的调色板索引都可以构成PoV。在嵌入信息前,载体图像中每一对像素素的两个值非均匀分布;嵌入信息后,每一对值的出现呈现相等的趋势(独立于所嵌入消息的长度)。由于将一个值转换为另外一个值不会改变图像中两个颜色出现的总数,因此可用此事实来设计卡方检验,即测试这样一个事实的统计显著性:每一对像素素两个值的出现是相同的。而且,如果从载体的左上角顺序地将消息比特嵌入到顺序的像素素索引系数中,那么统计结果会有明显的变化。该检测的思想则是:将理论上所期望的频率分布和在可能改动的载体图像中所观测的某些样本分布做一比较,从中发现变化。

(2)差异图像直方图的检测
    考虑到LSB掩密的性质,可选用差异图像直方图[2]作为统计分析工具。
通过对某些转换系数深入的分析得知,对于一个自然图像在LSB平面和其他比特平面间存在着弱相关性。随着嵌入越来越多的秘密消息,这种相关性变得越来越弱,最终LSB平面与其他比特平面相互独立。通过对差异图像直方图的对比,分析这种弱相关性,从而达到检测隐匿信息的目的。

3.2.2  RS检测
    应用含有秘密消息的图像的空间相关性,能够建立更为可靠和精确的检测方法。尽管如此,仍然很难揭示和量化图像中某种伪随机分量(比如LSB平面)和图像自身的关系。一旦使用一种方法量化了这种关系,就能够研究随着信息的嵌入图像会如何变化。这种量化的关系也就成为检测隐匿信息的基础。RS方法[3,4]是一种针对空域中LSB嵌入秘密信息的检测方法。根据不同的对应关系,根据R、S和U间的关系分为4类。RS检测的思想是估计这4类曲线,用外推法计算它们的交点,应用交点按照某种关系式计算图像中所含秘密信息的长度。

3.2.3  通用盲检测
    通用盲检测掩密分析法[5]是一种后验方法,在某种程度上可作相应的调整。根据载体图像和嵌入秘密消息后的图像进行大量的训练后,不管在什么域嵌入秘密消息均可对任何掩密算法进行有效检测。该方法试图发现一组具有“差异”容量的恰当敏感统计量(特征向量),使用神经网络、聚类算法和其他工具可找到正确的门限值并根据收集到的实验数据来构造检测模型。

4 掩密分析算法的分析与比较
    从上述的掩密分析算法可以看出,虽然都是基于LSB掩密的分析算法,但各个方法分析的角度不同,图像变换前后所显示的特性也各异,从而显示出各个掩密分析算法的不同的特点。对掩密分析算法的分析与比较如下:
    可视攻击打破了这样一个假设:在数字图像中亮度值的最不重要比特是完全随机的,因而也能够被替换。人们的视力通过训练可认知已知的实体,这种能力是可视攻击的基础。由于该方法直观、简单因而在一定程度上受到分析者的青睐。对于顺序的嵌入消息,应用该技术很容易检测到图像中是否存在隐匿的信息,但对于随机嵌入的消息比特该技术难以发挥其功用,而且使用该技术不能从隐匿信息的图像中辨别出噪声图像或者高度混合的图像。尽管它只需肉眼即可完成检测的目的,但是却难以实现程序化,可靠性也成问题。
    在众多的基于LSB隐匿算法的检测技术中最为有效和可靠的是统计检测。从LSB掩密算法来看,它是以所嵌入消息的比特来替换图像像素素值的LSB从而达到嵌入消息的目的,直观上来看这种图像的变化微乎其微不至于引起人们视觉上的怀疑,而图像像素素的统计特性却发生了比较显著的变化,通过判断给定图像的统计特性是否偏离了正常的情况,判断是否含有隐匿的信息。这几个统计检测方法的主导思想是围绕着图像中像素素值的LSB替换前后的统计特性进行的,如在PoV统计分析检测方法中根据图像中PoV的两个值(即该LSB替换前后的两个值)出现的频率相同的事实,在RS检测方法中根据若干像素素LSB替换后值的总的差异(差异函数的值)的不同进行分类,而在差异直方图中则是分析LSB替换后相邻像素素直方图的差异来进行检测。同样是统计检测的掩密分析方法,PoV统计检测方法采用假设检验中常用的较为精确的卡方检验,在某种概率下对图像作出是否含有隐匿信息的判断,但不能估算出所嵌入消息的比例,而RS检测和差异直方图检测方法则以嵌入信息比例为参数来构造若干关系式,估算所嵌入消息的长度,因而不仅以某种概率得出是否含有消息的判断,而且可估算出该概率下嵌入消息的尺寸。
    对于两种基于LSB的隐匿方式:顺序嵌入和随机嵌入消息比特,上述统计检测技术各有千秋。
针对顺序的图像LSB嵌入消息比特方式,上述统计检测方法都非常有效,尤其是基于直方图的PoV统计分析和差异图像直方图检测。
    对于非顺序或者随机的嵌入比特方式,差异图像直方图检测和RS检测都非常有效,而且有较高的可靠性。有数据表明差异图像直方图检测较之RS检测有着更高的实现速度,更利于对图像中隐匿信息的实时检测,对于原始无失真压缩图像,该检测比RS检测有更好的性能,而对于以JPEG格式存贮的图像,该检测与RS算法有同等的检测能力,而且对于检测随机分散在LSB平面的隐藏信息比检测使用顺序LSB嵌入的信息比特更为精确。RS检测的思想可扩充到LSB嵌入到调色板索引图像和JPEG图像的量化DCT系数的情况。现今RS检测已广泛应用在众多的商业掩密分析软件产品,如Steganos、Windstorm、S-Tools和Hide4PGP中。通用盲检测非常重要是因为它灵活且具有针对新的或者未知的信息掩密技术快速调整的能力,但是该算法不能估计嵌入图像的消息长度。表1是对以上各个掩密检测方法的比较。

 

5 发展趋势和研究展望
    信息隐藏作为一门富有挑战性的信息学科,已引起世人关注。但其发展时间较短,理论基础还不完善,实用技术还欠成熟,对隐匿信息的检测与攻击更是如此,所以对于基于图像的掩密分析还应在以下方面进行广泛而深入的研究:

(1)频域中的检测技术。现有的基于LSB的隐匿算法大都是针对空间域的,这些检测技术比较成熟和完善,这对于空间域的LSB隐匿算法是一个极大的挑战,因此有些隐匿算法转向针对频域的设计,而现有的检测技术很难涉及到频域中,因此频域中的基于LSB的隐匿信息的检测将会是热门方向。

(2)建立相邻像素值或量化系数间相关性的统计模型,检测其相关性有无异常,根据其异常来推断秘密信息的存在。

(3)随着掩密技术的不断发展,将会不仅仅在LSB上嵌入秘密信息。因此应该利用数字信号处理和统计分析的相关知识建立统一的检测模型。


    总之,随着新的信息隐匿技术的涌现,相应的检测技术也在不断地发展与完善,反过来又促进了信息隐匿技术的不断提高,从而使检测技术成为信息隐匿技术的重要组成部分。

6 参考文献
[1] Westfeld A, Pfitzmann A. Attacks on Steganographic Systems [C]. IHW’99, Dresden, Germany, 1999.
[2] Zhang Tao, Ping Xijian. Reliable Detection of LSB Steganography Based on The Difference Image Histogram [C]. IMSP-P8: Watermarking II,2003.
[3] Fridrich J, Goljan M, Du R. Detecting LSB Steganography in Color and Gray-Scale Images [J]. IEEE Multimedia, 2001,(11):22—28.
[4] Farid H. Detecting Steganographic Message in Digital Images [C]. Report TR2001-412, Dartmouth Collage, 2001.
[5] Neil F Johnson, Sushil Jajodia. Steganalysis:The Investigation of Hidden Information [C]. the Proceedings of the1998 IEEE Information Technology Conference,Syracuse,New York,USA,1998.

收稿日期:2004-04-29

[摘要] 对掩密分析技术的研究可以提高和完善信息隐藏技术,保护国家机密、商业机密以及个人隐私不受侵犯,具有现实的研究意义。文章介绍了掩密技术及掩密分析技术,针对掩密分析技术在图像掩密中的应用,分类讨论了各种图像掩密分析算法,并对各种算法进行综合分析和比较。进一步,文章对该领域今后的发展趋势和研究方向发表了看法。

[关键词] 图像;掩密;掩密分析

[Abstract] Research on steganalysis helps improve steganography techniques and protect national and business classified information and personal privacy. Therefore, it is practically significant. Steganography and steganalysis are introduced in the paper. For the application of steganalysis in image, several steganalysis algorithms based on (Least Significant Bit Insertion) LSB in image are discussed, and analysis and comparison are made among these algorithms. In the end, the developing trend and research directions in this field are mentioned here.

[Keywords] image; steganography; steganalysis