首页> 中国专利> 基于分割的邻域最优概率视频隐写分析方法及系统

基于分割的邻域最优概率视频隐写分析方法及系统

摘要

本发明公开一种基于分割的邻域最优概率视频隐写分析方法及系统,根据视频特点从分割模式集合中选择一种;对一个视频帧统计所有宏块分割模式的邻域最优SAD的集合,计算一个视频帧的隐写分析特征,对特征进行合并,得到一个视频帧最终的隐写分析特征;按此,依次提取一个视频内所有帧的隐写分析特征。本发明面向视频运动矢量隐写方法的检测,针对传统的基于预测残差的隐写分析特征易受量化失真干扰的问题,通过宏块分割对量化失真的量化与邻域最优概率特征的结合,实现对运动矢量隐写方法的通用而精准的隐写分析。

著录项

  • 公开/公告号CN105933711A

    专利类型发明专利

  • 公开/公告日2016-09-07

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201610464312.7

  • 发明设计人 王丽娜;翟黎明;徐一波;

    申请日2016-06-23

  • 分类号

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人严彦

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-06-19 00:26:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-26

    授权

    授权

  • 2016-10-05

    实质审查的生效 IPC(主分类):H04N19/467 申请日:20160623

    实质审查的生效

  • 2016-09-07

    公开

    公开

说明书

技术领域

本发明涉及多媒体安全和数字媒体处理技术领域,特别涉及一种判别数字视频是否经过秘密信息嵌入的隐写分析技术方案。

背景技术

现代隐写术是一门利用数字媒体进行秘密通信的技术,而隐写分析是隐写术的反向检测技术,其目标是判断图像、音频、视频等数字媒体中是否隐藏有秘密信息。随着视频采集设备的普及和互联网视频应用的流行,数字视频成为极易获取的隐藏载体;视频载体体积较大,能为秘密信息提供足够的隐藏空间。近年来基于数字视频的隐写技术和工具逐渐增多,这对数字视频的隐写分析提出了严峻的挑战。

由于H.264/AVC是目前使用最为广泛的视频编码标准,在实际应用中极有可能成为视频信息隐藏载体,因此本文主要考虑基于H.264/AVC的视频隐写分析。

运动矢量(motion vector,MV)和预测残差是视频压缩编码中的重要参数。运动矢量是帧间编码中预测块与当前编码块之间的相对坐标距离,预测残差是当前编码块和预测块的差值。在视频编码端,运动矢量与预测残差一起成为压缩码流,被用来传输或存储;在视频解码端,通过从码流中提取运动矢量和预测残差即可重建原始视频。

视频编码的主要目的是在保证视频质量的前提下使视频码流尽可能的少。在视频的帧间编码中,编码器采用运动估计(motion estimation,ME)来寻找最优的运动矢量,使得编码运动矢量和预测残差所需比特数达到最小[1]。这个过程通常由率失真优化模型来实现,即使得一定的拉格朗日代价函数达到最小,最常见的拉格朗日代价函数如下式:

J=SAD+λ·BITS(MVD)(式1)

其中SAD是预测残差PE的绝对误差和,MVD是运动矢量残差(motion vector difference,MVD),BITS(MVD)代表编码MVD所需的比特数,λ是拉格朗日乘子,其取值通常如下[2]:

其中QP是量化参数(quantization parameter,QP)。

H.264/AVC视频编码块的最大尺寸固定为16×16,称之为宏块。为了更好地逼近视频场景中的物体形状和达到更加精确的匹配效果,在ME过程中宏块往往需要进一步被分割成多个子块,这种情况称作可变块尺寸(variable block size,VBS)。H.264/AVC规定一个16×16的宏块可以被划分成一个16×16分割,两个16×8分割,两个8×16分割或四个8×8分割,这些分割被称作宏块分割(MB partitions)。8×8分割也叫子宏块,它还可以继续被划分成一个8×8分割,两个8×4分割,两个4×8分割或四个4×4分割,这些分割被称作子宏块分割(subMB partitions)。上述宏块分割模式如图1所示。

基于运动矢量的视频隐写方法是视频隐写术的热点。该类方法通过直接修改运动矢量的数值并同时调整对应的预测残差,来达到嵌入秘密信息的目的。

由于视频编码的最优性原则,在视频的编码端,对于未经隐写的视频(cover),最优运动矢量所对应的预测残差的SAD通常具有较小的数值,即存在局部最优性;而对于隐写嵌入之后的视频(stego),运动矢量由最优变成次优,其对应的预测残差的SAD可能具有较大的数值,而其局部最优性也随之改变[3][4]。

当前最有效的隐写分析特征是基于预测残差的局部最优性而构建的[3]。由于视频编码过程中的量化步骤是有损压缩,预测残差及其SAD的局部最优性在视频的编码端和解码端会有所不同。而基于预测残差的隐写分析特征只能从视频的解码端构造,因此该类特征不可避免的要受到量化失真的干扰。另外,基于预测残差的隐写分析特征只利用了SAD的局部最优性[3][4],而隐写嵌入对运动矢量的修改还改变了SAD的邻域最优性的统计规律,目前尚未有研究提出相关技术方案。

因此,如何利用预测残差来构造有效的隐写分析特征,并降低量化失真对特征的干扰,以提高隐写分析的检测率,对于隐写分析具有重要的意义。

参考文献:

[1]I.Richardson,The H.264Advanced Video Compression Standard.New York,NY,USA:Wiley,2010.

[2]Wiegand T,Schwarz H,Joch A,et al.Rate-constrained coder control and comparison of video coding standards[J].Circuits and Systems for Video Technology,IEEE Transactions on,2003,13(7):688-703.

[3]Wang K,Zhao H,Wang H.Video steganalysis against motion vector-based steganography by adding or subtracting one motion vector value[J].Information Forensics and Security,IEEE Transactions on,2014,9(5):741-751..

[4]Ren Y,Zhai L,Wang L,et al.Video steganalysis based on subtractive probability of optimal matching feature[C]//Proceedings of the 2nd ACM workshop on Information hiding and multimedia security.ACM,2014:83-90.

发明内容

本发明针对现有基于预测残差的隐写分析特征所存在的问题,实现一种鲁棒性强、准确率高的通用隐写分析特征,提供基于分割的邻域最优概率视频隐写分析技术方案。

本发明技术方案提供一种基于分割的邻域最优概率视频隐写分析方法,其特征在于:在隐写分析特征构造时执行以下步骤,

步骤1,根据视频特点,从以下分割模式集合中选择一种,

步骤2,对于一个视频帧,统计所有宏块分割模式的邻域最优SAD的集合实现如下,

设p是分割模式的索引,p=1,…,P,P为步骤1所选模式集合中的分割模式数目,设某视频帧中第l个运动矢量为Vl=(Vlh,Vlv),Δh和Δv分别是Vlh和Vlv的改变量,局部八邻域记为

其中,l是分割在第p种分割模式中的索引;为步骤1所选模式集合中分割模式p下的

步骤3,计算一个视频帧的隐写分析特征fp,i如下,

其中,Lp是第p种分割模式中的分割的总数,表示集合中的元素个数;如果则参数否则

步骤4,根据预设的阈值T,对特征fp,i进行合并,得到一个视频帧最终的隐写分析特征Fp,i

Fp,i=fp,iifi[0,T)Σj=T8fp,jifi=T

步骤5,返回步骤2对下一视频帧进行处理,依次提取一个视频内所有帧的隐写分析特征。

一种基于分割的邻域最优概率视频隐写分析系统,在隐写分析特征构造子系统设置包括以下模块,

第一模块,用于根据视频特点,从以下分割模式集合中选择一种,

第二模块,用于对于一个视频帧,统计所有宏块分割模式的邻域最优SAD的集合实现如下,

设p是分割模式的索引,p=1,…,P,P为第一模块所选模式集合中的分割模式数目,设某视频帧中第l个运动矢量为Vl=(Vlh,Vlv),Δh和Δv分别是Vlh和Vlv的改变量,局部八邻域记为

其中,l是分割在第p种分割模式中的索引;为第一模块所选模式集合中分割模式p下的

第三模块,用于计算一个视频帧的隐写分析特征fp,i如下,

其中,Lp是第p种分割模式中的分割的总数,表示集合中的元素个数;如果则参数否则

第四模块,用于根据预设的阈值T,对特征fp,i进行合并,得到一个视频帧最终的隐写分析特征Fp,i

Fp,i=fp,iifi[0,T)Σj=T8fp,jifi=T

第五模块,用于命令第二模块对下一视频帧进行处理,依次提取一个视频内所有帧的隐写分析特征。

本发明公开一种基于分割的邻域最优概率视频隐写分析特征构造技术方案,面向视频运动矢量隐写方法的检测,针对传统的基于预测残差(prediction error,PE)的隐写分析特征易受量化失真干扰的问题,从两个方面构造隐写分析特征。首先,提出一种量化失真的量化方法,利用视频的宏块分割模式来衡量PE的量化失真大小;其次,根据隐写嵌入对运动矢量邻域范围内的绝对误差和(sum of absolute difference,SAD)的最优性的改变,提出一种邻域最优概率特征。通过宏块分割对量化失真的量化与邻域最优概率特征的结合,实现对运动矢量隐写方法的通用而精准的隐写分析。本发明的优势在于,目前还未出现有效的方法来减少量化失真对基于预测残差的隐写分析特征的干扰,而本发明使特征根据量化失真的程度进行细分,能有效降低量化失真对特征的敏感性的影响,该技术方案具有较强的通用性,有利于提高隐写分析的检测效果。

附图说明

图1为宏块分割和宏块子分割的示意图。

图2为宏块分割模式与QP、α的关系示意图。

图3为运动矢量和预测残差的局部3×3窗口示意图,其中图3a为以原始运动矢量为中心的3×3运动矢量窗口,图3b为对应的3×3SAD窗口。

图4为宏块分割模式与邻域最优概率的关系示意图,其中图4a为cover视频的关系示意图,图4b为stego视频的关系示意图。

图5为本发明实施例的隐写分析特征构造流程图。

具体实施方式

以下结合附图和实施例详细说明本发明技术方案。

本发明采用宏块分割模式和邻域范围内预测残差的SAD的局部最优性来构造隐写分析特征,并结合SVM分类器来训练隐写分析模型和测试视频样本。本发明实施例的技术方案的原理如下:

1特征构造方法

1.1量化失真的量化方法

1.1.1量化失真与宏块分割模式的关系

文献[3]假设预测残差PE的2D-DCT系数服从如下拉普拉斯分布:

其中,y是预测残差PE的2D-DCT系数,|y|表示y的绝对值,α是拉普拉斯分布的参数。并进一步得出结论:量化失真与量化参数QP呈正相关关系,而与分布参数α呈负相关关系,其中α与运动估计ME的准确性有关。

QP表示视频的压缩程度;α代表2D-DCT系数的分布形状,α越小则分布越平缓,反之则分布越陡峭。然而在采用固定压缩率的视频中,每个编码块的QP是变化的;α则与视频场景运动快慢、纹理复杂度和搜索算法是否合理有关[3],二者都不容易确定和衡量。这意味着视频每个编码块的量化失真(SAD局部最优性)程度呈现多变性和不确定性,如果对这种情况不加以区分将会降低基于PE的隐写分析特征的检测性能;如果能对量化失真的范围进行量化,不同程度的量化失真分别对应着各自的PE特征,将有利于提高隐写分析的效果。下面将研究如何对量化失真进行量化。

对于式3,本发明可以得出该分布的期望E(y)=0,方差Var(y)=2/α2,同时可得到y的二阶原点矩E(y2)如下式:

以分割为单位,设其预测残差PE为pi,j,PE的2D-DCT系数符号y相应记为yi,j,i=0,1,…,M-1,j=0,1,…,N-1,其中M和N分布是分割的高和宽。根据正交变换的能量或范数保持不变性质,离散余弦变换DCT只是改变了能量的分布,而变换前后能量保持不变,因此可得:

根据式4和式5,本发明可以得到下式:

设分割的均值平方误差(mean squared error,MSE)记为MSE,可得:

根据式6和式7,本发明可以得到下式:

从式8可以看出,MSE等于pi,j的方差。另外文献[1]指出SAD随着MSE单调递增,因此本发明可以得出结论:

其中,SAD表示预测残差PE的绝对误差和。

QP与MSE和SAD也具有一定的关系。对于同一个编码块,根据式1和式2,QP越大,λ就越大,拉格朗日代价函数中MVD所占比重就会增加,这就限制了MV的搜索范围,使得找到较为匹配的参考块的概率变小,导致得到更大的MSE和SAD。因此QP和α都可以利用MSE和SAD来粗略地衡量。

虽然可以使用MSE和SAD对量化失真进行量化,但MSE和SAD本身的取值范围同样很广,MSE还是浮点数,导致可操作性较低。另外,本发明发现MSE和SAD与宏块的分割模式之间也存在简单的单调性,比如分割的尺寸越大,MSE和MAD(为比较不同尺寸的分割的SAD,用差值平方和(mean absolute difference,MAD)来代替,它是SAD的平均值)就越小。为证明该说法,下面比较akiyo(静态、纹理简单)、soccer(运动剧烈、纹理丰富)这两个视频的不同分割所对应的平均MSE、平均SAD、分割所占比例及其局部最优性的比例,如图2所示,不同宏块分割和不同QP情况下的平均MSE、平均MAD、宏块分割比例(partition proportion,PP)和局部最优概率(local optimal probability,LOP),其中(a)部分为akiyo,QP25;(b)部分为akiyo,QP35;(c)部分为soccer,QP25;(d)部分为soccer,QP35。

1.1.2宏块分割模式的原理分析

QP和α与宏块分割模式之间的关系也可以直观的得出,其原理如下:由于QP越大,ME会趋于减小MVD码流的大小,很显然选择较大的宏块分割来减少MV的数量更能节约MVD码流。例如在图2中,尺寸为16×16的分割在QP取值较大时,其所占的比例PP也比较大。对于α,除了搜索算法与分割模式的关系不明显之外,运动越剧烈,纹理越复杂,较小的分割就越适合反映运动状态和越有利于描述纹理细节。例如在图2中,同样是小尺寸的分割,soccer视频中的PP会更大一些。基于上述原因,再加上分割模式操作起来简单易行,可以用它来代替MSE和SAD对编码块的量化失真进行量化。

1.2基于分割的邻域最优概率特征

1.2.1邻域最优概率的原理

设cover视频一帧中第l个运动矢量为Vl=(Vlh,Vlv),其中Vlh和Vlv分别是Vl的水平分量和垂直分量。由于基于运动矢量的隐写方法通常是修改运动矢量的一个或两个分量的最低重要位(least>l在嵌入过程中可能的取值变化会形成一个3×3窗口,记为

其中Δh和Δv分别是Vlh和Vlv的改变量。如果只关注运动矢量修改的部分,则形成一个局部八邻域

对应着一个可能取值的运动矢量集合

其中表示没有经过修改的原始的运动矢量,表示修改过的运动矢量。基于运动矢量的隐写嵌入虽然只是修改MV,但同时也需要重新进行运动补偿获得新的PE以避免给重建块带来误差,因此也对应着一个可能取值的SAD集合与在中的分布形式如图3a和图3b所示,其中表示cover视频中没有经过修改的原始的绝对误差和,表示修改过的绝对误差和。

在cover视频中,由于SAD的局部最优性,往往有把这种称为局部最优SAD(LO-SAD);而在stego视频中,对于修改过LSB的MV,修改前的MV仍然存在其八邻域内,一般会有把这种称为邻域最优SAD(NO-SAD)。这是视频编码端的情形,而在视频解码端,上述规律仍然在一定程度上得以保持[3]。

因此可以说,在cover视频中,邻域最优SAD出现的概率通常会比较小;在stego视频中,概率通常会比较大,其中

对于cover视频和stego视频的邻域最优SAD,除了存在概率上的区别,还具有数量上的差异。在编码块的八邻域内,邻域最优SAD的数量取值范围为0-8,其中0意味着该块不存在邻域最优SAD,而存在局部最优SAD。cover视频中的邻域最优SAD主要由量化失真引起;而stego视频中邻域最优SAD的产生,除了有量化失真的因素外,还有隐写嵌入的影响。因此,邻域最优SAD在cover视频和stego视频中数量上的分布也会有所不同。这一结论可以通过如下实验证明。

针对不同的分割模式,cover视频和stego视频的邻域最优SAD在不同数量上的平均概率见图4,实验采用36对cover视频和stego视频,视频来自标准测试视频序列,stego视频的嵌入方式是采用LSBM修改较大的MV分量,两类视频的QP均为25。从图4a和图4b中可以明显看出,在stego视频中,邻域最优SAD数量为0的比例要小于cover视频,而邻域最优SAD数量大于0的分割的比例要远大于cover(邻域最优SAD数量为1-4时尤其明显)。另外还可以看到,不管是cover视频还是stego视频,邻域最优SAD数量为0的分割都是最多的,随着分割尺寸的减小,邻域最优SAD数量不为0的比例逐渐增加,这也证明了量化失真在不同分割模式上的影响大小。

下面将通过邻域最优SAD的数目在不同取值时的概率,结合分割模式来构造基于分割的邻域最优概率(partition based neighborhood optimal probability,PB-NOP)特征。

1.2.2邻域最优概率特征的提取

根据图1,设P16×16,P16×8,P8×16,P8×8,P8×4,P4×8,P4×4代表宏块的原有的7种分割模式,定义以下4种新的宏块分割模式,可称为模式集合:

其中,把所有的分割模式视为一种,相当于没有考虑分割尺寸的影响;具有两种宏块分割模式,即把宏块分割中的4种分割模式合成一种模式,把子宏块分割中的3种分割模式合成另一种模式;按照原有分割模式的面积大小,形成5种新的宏块分割模式;则采用原来的7种宏块分割模式,没有进行合并。

设单个分割的局部邻域最优SAD的集合为:

其中,p是分割模式的索引,p=1,…,P,模式集合中的分割模式数目实施例中i∈{1,2,5,7};l是该分割在第p种分割模式中的索引;为模式集合中分割模式p下的其分割模式为p;则是模式集合中分割模式p下的

则第p种分割模式的特征fp,i为:

其中Lp是第p种分割模式中的分割的总数;表示集合中的元素个数;如果则参数否则i是指的取值,也就是局部八邻域中的邻域最优SAD(NO-SAD)的个数。

通过图3和图4可以看出,相同尺寸面积的分割具有相近的局部或邻域最优概率分布,因此PB-NOP采用分割模式(额外实验也证明PB-NOP采用时检测效果最好);另外通过图4还可以看到,当取值较大(大于5)时,fp,i的取值都极小,为了使特征更紧凑和提高特征的鲁棒性,使用特征阈值对部分特征进行合并,得到合并之后的特征Fp,i的表达方式:

其中T是特征阈值,在实施例中,取T=5,具体实施时本领域技术人员可预设取值。因此PB-NOP的特征维度为P(T+1)=30。

2隐写分析检测

隐写分析检测的基本过程如下:

步骤2.1,输入YUV格式的视频样本,如果视频是H.264压缩格式,需要先转换成YUV格式。利用H.264/AVC视频编码器和隐写工具分别生成数量相同的cover样本和对应的stego样本。

步骤2.2,把2.1得到的成对的视频样本随机分成数量相同两部分,一部分作为训练集,另一部分作为测试集来验证分类模型的效果。

步骤2.3,按照1部分中的方法提取训练集和测试集样本的隐写分析特征。

步骤2.4,利用训练集中的cover样本特征和对应的stego样本特征,并结合LibSVM分类器来训练通用的隐写分析模型。

步骤2.5,用测试集样本的特征来验证隐写分析模型的检测性能。

参见图5,本发明实施例提供一种面向视频运动矢量隐写术的隐写分析特征构造方法,步骤2.3中的隐写分析特征的具体构造过程包括以下步骤:

步骤2.2.1,根据视频本身的特点,通过式13选择合适的新的分割模式,即模式集合例如,如果视频包含较多属于运动剧烈和和纹理复杂的内容,则应使取较大的数值,例如和反之则应使取较小的数值,例如和在本发明实施例中选择分割模式具体实施时,可由本领域技术人员自行选择设定。

步骤2.2.2,对于一个视频帧,根据式14统计所有宏块分割模式的邻域最优SAD的集合实施例中即p=1,2,…,5,i=0,1,…,8。

步骤2.2.3,根据式15计算一个视频帧的隐写分析特征fp,i,p=1,2,…,5,i=0,1,…,8。

步骤2.2.4,根据式16和阈值T,对特征fp,i进行合并,得到一个视频帧最终的隐写分析特征Fp,i

步骤2.2.5,返回步骤2.2.2对下一视频帧进行处理,重复步骤2.2.2-2.2.4,依次提取一个视频内所有帧的隐写分析特征。

具体实施时,可采用计算机软件方式支持自动运行流程。一般可以在步骤2.2.2先判断是否存在下一个视频帧,是则继续流程,否则结束。

具体实施时,也可采用模块化方式实现相应系统。实施例提供一种基于分割的邻域最优概率视频隐写分析系统,在隐写分析特征构造子系统设置包括以下模块,

第一模块,用于根据视频特点,从以下分割模式集合中选择一种,

第二模块,用于对于一个视频帧,统计所有宏块分割模式的邻域最优SAD的集合实现如下,

设p是分割模式的索引,p=1,…,P,P为第一模块所选模式集合中的分割模式数目,设某视频帧中第l个运动矢量为Δh和Δv分别是和的改变量,局部八邻域记为

其中,l是分割在第p种分割模式中的索引;为第一模块所选模式集合中分割模式p下的

第三模块,用于计算一个视频帧的隐写分析特征fp,i如下,

其中,Lp是第p种分割模式中的分割的总数,表示集合中的元素个数;如果则参数否则

第四模块,用于根据预设的阈值T,对特征fp,i进行合并,得到一个视频帧最终的隐写分析特征Fp,i

Fp,i=fp,iifi[0,T)Σj=T8fp,jifi=T

第五模块,用于命令第二模块对下一视频帧进行处理,依次提取一个视频内所有帧的隐写分析特征。

各模块具体实现可参见相应步骤,本发明不予赘述。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号