首页> 中国专利> 一种面向AAC数字音频的通用隐写分析方法

一种面向AAC数字音频的通用隐写分析方法

摘要

本发明公开了一种面向AAC数字音频的通用隐写分析方法,本发明采用Markov转移概率和累积邻接密度作为相关性评价标准从帧间和帧内提取相关性子特征,根据AAC编码特性对子特征进行融合,采用随机森林分类器对AAC样本进行二分类。本发明针对不同隐写算法的stego样本统一训练分类模型,实现了面向AAC的通用隐写分析。

著录项

  • 公开/公告号CN105118512A

    专利类型发明专利

  • 公开/公告日2015-12-02

    原文格式PDF

  • 申请/专利权人 武汉大学;

    申请/专利号CN201510437226.2

  • 发明设计人 任延珍;熊浩;王丽娜;

    申请日2015-07-23

  • 分类号G10L19/018(20130101);G10L25/27(20130101);

  • 代理机构武汉科皓知识产权代理事务所(特殊普通合伙);

  • 代理人薛玲

  • 地址 430072 湖北省武汉市武昌区珞珈山武汉大学

  • 入库时间 2023-12-18 12:40:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-13

    授权

    授权

  • 2015-12-30

    实质审查的生效 IPC(主分类):G10L19/018 申请日:20150723

    实质审查的生效

  • 2015-12-02

    公开

    公开

说明书

技术领域

本发明属于数字媒体处理技术领域,特别涉及一种判别AAC音频是否经过 秘密信息隐写的方法。

技术背景:

移动通信技术的飞速发展,使得MP3、AAC等音频压缩标准在移动互联网中 得到广泛应用,同时面向此类压缩音频的隐写算法和工具也逐渐涌现,给音频隐 写分析带来了新的挑战。AAC(AdvancedAudioCoding,高级音频编码)是3GPP 组织指定的音频压缩标准,其目的是取代MP3标准。与MP3相比,AAC的压缩性 能更加高效,已经被各大厂商设备所支持,如Apple、Nokia、Sony、Real等。 AAC的隐写嵌入域主要包括MDCT系数、量化参数、以及Huffman编码参数等。 MDCT系数是AAC的主要编码参数,占AAC数据总量的70%以上,由于MDCT系数 的局部微量调整不会带来明显的听觉感知,因此通过对MDCT系数进行修改的隐 写算法具有良好的隐蔽性和隐藏容量。

目前针对MP3的隐写分析方法相对较多,但是针对AAC压缩域的通用隐写分 析方法还未见公开文献。由于MP3与AAC编码原理的相似性,因此面向MP3的隐 写分析方法可以对AAC隐写分析方法的提出起到一定的参考作用。MP3的隐写嵌 入域与AAC基本相同,目前针对MP3的隐写分析方法主要集中在MP3Stego,现 有隐写分析方法从两个角度进行分析,一类是专用隐写分析思路,即从隐写算法 对音频压缩数据所引入的参数变化进行分析,此类方法专用性强,对于其他修改 MDCT系数的隐写方法则无效。第二类采用通用隐写分析思路,即从隐写算法所 引入的MDCT系数之间的关系统计特性方面进行分析,这类算法不仅可以针对 MP3Stego隐写分析工具,对于其他MDCT系数修改类隐写方法也具有一定的适用 性。

但是,现有MP3的隐写分析思路主要针对MP3Stego隐写方法,由于MP3Stego 隐写时根据秘密信息控制量化过程,导致相邻帧间量化步长的差异增大,经过量 化后,MP3同一子带间的MDCT系数相关性有明显的减弱,因此在针对MP3Stego 进行隐写分析时,从帧间同一子带提取相关性特征能取得较好的检测效果。然而 AAC的MDCT隐写算法是对帧内不同区域的MDCT系数进行微小的调整,由于MDCT 系数修改位置的不确定性以及MDCT系数修改数量的限制,导致隐写对帧间相关 性的影响并不大,将现有针对MP3的帧间隐写分析特征直接应用于AACMDCT的 通用隐写分析效果并不明显。

本发明的通用隐写分析检测方法基于AAC(AdvancedAudioCoding),在发 明内容陈述之前需要对AAC的编解码原理进行介绍。

如图1所示为AAC的编码原理,其编码过程包括5个主要步骤:心理声学模 型分析、滤波器MDCT变换、可选编码模块、MDCT系数量化和熵编码,其中MDCT 变换和量化过程是AAC编码的核心处理过程。AAC采用时域混叠编码方式,对输 入的脉冲编码调制时域音频信号进行分帧,每帧包含1024个时域抽样信号,当 前帧与前一帧时域样本信号共同组成2048个时域抽样信号,经过心理声学模型 分析,判断窗长度(滤波器每次进行MDCT变换的长度),对每个窗计算全局增益, 然后按窗进行滤波器MDCT变换,得到1024个频谱系数经过可选编码模块(时 域噪声整形、联合立体声编码、预测模块等频域处理)后,对得到的MDCT系数 按比例因子带进行量化,最后通过Huffman编码,与其他编码参数共同组成AAC 音频码流。

其中相关术语解释如下:

(1)压缩音频:指经过有损压缩的音频,如MP3、WMA、AAC均为有损压缩音频。

(2)量化:为了降低编码复杂度,使用比例因子将较大的MDCT系数量化为编码 适合的MDCT系数,量化过程属于有损过程。

(3)Cover:载体音频,即未进行秘密信息嵌入的音频。

(4)Stego:载密音频,即进行了秘密信息嵌入的音频。

(5)帧间关系:表示以帧为独立单位的前后两帧之间的关系。

(6)帧内关系:表示以单个MDCT系数为单位与其前后MDCT系数之间的关系。

(7)差分:表示一组信号之间的噪声残差。

(8)子特征:采用一种特征提取方式得到的特征子集合。

(9)特征集合:将多种子特征经过融合之后得到的高维特征集。

(10)随机森林分类:采用随机森林分类器对待测样本进行二分类(即划分为 cover或者stego)。

发明内容

本发明针对目前面向AAC隐写分析方法相对缺少的问题,提供了一种面向 AAC数字音频的通用隐写分析方法。

本发明所采用的技术方案是:一种面向AAC数字音频的通用隐写分析方法, 其特征在于,包括以下步骤:

步骤1:提取AAC音频长帧特征和短帧特征,其具体实现包括以下子步骤:

步骤1.1:将AAC文件解码至IMDCT变换阶段,得到量化MDCT系数,并将 量化MDCT系数按帧类型分为两个集合:长帧集合Fl和短帧集合Fs,对其分别构 造MDCT系数矩阵Ml和Ms,将Fl集合每一帧MDCT系数作为该相关性矩阵的一行:

其中,fil为Fl中第i帧的MDCT系数,Nl为Fl内帧的数量;

将Fs集合每一帧的1024个MDCT系数转化为一个8*128子矩阵,然后将所有 子矩阵按行排列形成一个新矩阵:

其中,为Fs中第i帧的MDCT系数,Ns为Fs集合中帧的数量;

步骤1.2:对矩阵Ms和Ml分别计算帧间、帧内的一阶差分和二阶差分,每 个集合可以得到4个差分矩阵其中order表示差分阶数,取值1或2; type表示特征提取的方向,取值“inter”或“intra”;“inter”表示帧间相邻 系数之间的差分,“intra”表示帧内相邻系数之间的差分,r,c分别为矩阵M 的行和列的索引;

(式一);

(式二);

(式三);

(式四);

步骤1.3:对差分矩阵按式五进行阈值处理, 设置阈值T,对任意xr,c{xr,c|xr,c∈D},r、c为矩阵D的行列索引;

(式五);

步骤1.4:对差分矩阵D计算Markov转移概率和累积邻接密度,MDCT系数 差分矩阵D的Markov转移概率IM的计算式为式六,累积邻接密度INJ的计算 式为式七,在帧内相关性特征提取时,概率计算方向为帧内方向(即水平方向); 在帧间相关性特征提取时,概率计算方向为帧间方向(即垂直方向);

(式六);

(式七);

其中,m,n∈[-4,4],Nr,Nc分别为差分矩阵D的行数和列数;δ(·)为数学算 子,条件满足时为值1,否则为0;当计算帧间关系时,k1=1,k2=0;当计算帧 内关系时,k1=0,k2=1;每个差分矩阵得到两个子特征,两个集合共得到16种 隐写分析子特征;

步骤1.5:将两个集合的隐写分析子特征赋予权值,融合后形成最终的隐写 分析集合G:

G={αC(Ml),βC(Ms)}(式八);

其中,C(·)为相关性计算运算,α和β分别为C(Ml)和C(Ms)对特征集合G的 贡献程度;

步骤2:将得到的隐写分析集合G采用随机森林分类器进行分类,其具体实 现包括以下子步骤:

步骤2.1:分类器训练,得到通用隐写分析模型;

步骤2.2:利用步骤2.1中得到的通用隐写分析模型对样本进行隐写分析检 测,得到样本的隐写判断结果。

作为优选,步骤1.3中所述的T=4。

作为优选,步骤1.5中所述的α和β,其计算公式为:

其中Nl为长帧数量,Ns为短帧数量。

作为优选,步骤2.1中所述的分类器训练,其具体实现包括以下子步骤:

步骤2.1.1:输入Wav样本,分别生成cover样本和对应的stego样本,并 按照步骤1的方法提取分类特征;

步骤2.1.2:经过步骤2.1.1过程后,得到训练集样本和数量相等的不同嵌 入算法载密样本,然后随机选择不同数量的stego样本和对应的cover样本共同 训练通用隐写分析模型。

作为优选,步骤2.2中所述的利用步骤2.1.2中得到的通用隐写分析模型对 样本进行隐写分析检测,其具体实现包括以下子步骤:

步骤2.2.1:提取待测样本的隐写分析特征集合;

步骤2.2.2:将特征输入通用隐写分析模型,得到样本的隐写判断结果。

本发明的技术方案采用Markov转移概率和累积邻接密度作为相关性评价标 准从帧间和帧内提取相关性子特征,根据AAC编码特性对子特征进行融合,采 用随机森林分类器对AAC样本进行二分类。本发明针对不同隐写算法的stego 样本统一训练分类模型,实现了面向AAC的通用隐写分析。

附图说明

图1:是本发明现有技术中AAC编解码流程图;

图2:是本发明实施例中AACMDCT系数帧间一阶差分Markov相关性特征差异 图,其中(a)为载体音频,(b)为载密音频,(c)为载体音频和载密音频的特征 差;

图3:是本发明实施例中AACMDCT系数帧间二阶差分Markov相关性特征差异 图,其中(a)为载体音频,(b)为载密音频,(c)为载体音频和载密音频的特 征差;

图4:是本发明实施例的特征提取流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对 本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解 释本发明,并不用于限定本发明。

本发明针对目前面向AAC隐写分析方法相对缺少的问题,提供了一种面向 AAC数字音频的通用隐写分析方法,包括以下步骤:

步骤1:提取AAC音频长帧特征和短帧特征,其具体实现包括以下子步骤:

步骤1.1:将AAC文件解码至IMDCT变换阶段,得到量化MDCT系数,并将 量化MDCT系数按帧类型分为两个集合:长帧集合Fl和短帧集合Fs,对其分别构 造MDCT系数矩阵Ml和Ms,将Fl集合每一帧MDCT系数作为该相关性矩阵的一行:

其中,fil为Fl中第i帧的MDCT系数,Nl为Fl内帧的数量;

将Fs集合每一帧的1024个MDCT系数转化为一个8*128子矩阵,然后将所有 子矩阵按行排列形成一个新矩阵:

其中,fis为Fs中第i帧的MDCT系数,Ns为Fs集合中帧的数量;

步骤1.2:对矩阵Ms和Ml分别计算帧间、帧内的一阶差分和二阶差分,每 个集合可以得到4个差分矩阵其中order表示差分阶数,取值1或2; type表示特征提取的方向,取值“inter”或“intra”;“inter”表示帧间相邻 系数之间的差分,“intra”表示帧内相邻系数之间的差分,r,c分别为矩阵M 的行和列的索引;

(式一);

(式二);

(式三);

(式四);

步骤1.3:对差分矩阵按式五进行阈值处理, 设置阈值T=4,对任意xr,c{xr,c|xr,c∈D},r、c为矩阵D的行列索引;

(式五);

步骤1.4:对差分矩阵D计算Markov转移概率和累积邻接密度,MDCT系数 差分矩阵D的Markov转移概率IM的计算式为式六,累积邻接密度INJ的计算 式为式七,在帧内相关性特征提取时,概率计算方向为帧内方向;在帧间相关性 特征提取时,概率计算方向为帧间方向;

(式六);

(式七);

其中,m,n∈[-4,4],Nr,Nc分别为差分矩阵D的行数和列数;δ(·)为数学算 子,条件满足时为值1,否则为0;当计算帧间关系时,k1=1,k2=0;当计算帧 内关系时,k1=0,k2=1;每个差分矩阵得到两个子特征,两个集合共得到16种 隐写分析子特征;

步骤1.5:将两个集合的子特征以各帧类型在AAC音频中所占的比例赋予权 值,融合后形成最终的隐写分析集合G,其中Nl为长帧数量,Ns为短帧数量:

G={αC(Ml),βC(Ms)}(式八);

其中,C(·)为相关性计算运算,α和β分别为C(Ml)和C(Ms)对特征集合G的 贡献程度;

由于音频信号中相邻MDCT系数具有一定的相关性,以上隐写方法均带来AAC 码流中MDCT系数值的改变,引起帧内相邻MDCT系数值和帧间相邻MDCT系数值 之间关系上的变化。图2所示为码率为96kbps,采用文献[ZhuJ,WangR,YanD. ThesignbitsofHuffmancodeword-basedsteganographyforAACaudio[C].Ningbo, China:IEEEComputerSociety,2010]中的方法,在相对嵌入率为100%的情况下载 体音频(cover)和载密音频(stego)之间MDCT系数帧间一阶差分的Markov 转移概率之间的差异;图3所示为该音频MDCT系数帧间二阶差分的Markov转移 概率之间的差异。由图可见,cover音频和stego音频在隐写前后MDCT系数之 间的相关性发生了改变。

虽然隐写对MDCT系数的相关性有所改变,但是由于样本的多样性,单一的 帧间或帧内相关性统计特征并不能有效的对cover音频和stego音频进行有效的 区分,因此,本发明针对帧内和帧间MDCT系数关系构造多个相关性统计子特征, 并利用随机森林组合分类器对融合后特征进行分类。

步骤2:将得到的隐写分析集合G采用随机森林分类器进行分类,其具体实 现包括以下子步骤:

步骤2.1:分类器训练,其具体实现包括以下子步骤:

步骤2.1.1:输入Wav样本,分别生成cover样本和对应的stego样本,并 按照步骤1的方法提取分类特征;

步骤2.1.2:经过步骤2.1.1过程后,得到训练集样本和数量相等的不同嵌 入算法载密样本,然后随机选择不同数量的stego样本和对应的cover样本共同 训练通用隐写分析模型;

步骤2.2:利用步骤2.1.2中得到的通用隐写分析模型对样本进行隐写分析 检测,得到样本的隐写判断结果,其具体实现包括以下子步骤:

步骤2.2.1:提取待测样本的隐写分析特征集合;

步骤2.2.2:将特征输入通用隐写分析模型,得到样本的隐写判断结果。

为了验证本发明算法的有效性,本发明针对不同隐写方法训练通用的隐写分 析模型,实验结果如表1所示。其中TPR表示载密音频(stego)的检测为stego的 概率,TNR表示载体音频(cover)检测为cover的检测率。

实验结果表明,在96kbps和128kbps编码模式下,本文通用模型对已有的三 种针对MDCT系数修改的隐写方法都有较好的检测能力,在相对嵌入率为50% 时,检测率都能达到80%以上,在相对嵌入率为80%时,检测率都能达到95% 以上。

表1隐写分析实验结果

其中:

Wang[1]表示文献[Wang,Y,L.GuoandC.Wang.SteganographyMethodfor AdvancedAudioCoding.JournalofChineseComputerSystem,2011.07.]中记载的方 法;

Zhu[2]表示文献[ZhuJ,WangR,YanD.ThesignbitsofHuffman codeword-basedsteganographyforAACaudio[C].Ningbo,China:IEEEComputer Society,2010.]中记载的方法;

Zhu[3]表示文献[Zhu,J..TheresearchoninformationhidinginMPEG-2/4 AdvancedAudioCoding(AAC)[D].NingboUniversity,2012.]中记载的方法;

下面本发明对基于长短帧特性融合算法对隐写分析检测性能的影响进行分 析。分别对以下三种模式提取特征的检测性能进行对比分析,载密样本采用算法 Zhu[2]。

模式一:在特征提取时不按照帧类型对AAC数据帧进行划分。

模式二:在特征提取时按照帧类型将AAC数据帧划分为两个集合,但是对每 个集合提取隐写分析特征后并不对每个特征集合增加权值。

模式三:特征提取时按帧类型将AAC数据帧划分为两个集合,并对每个集合 提取的隐写分析特征进行加权处理。

利用上述特征提取模式验证本发明算法的有效性包括以下步骤:

步骤1:利用不同的特征提取方式对训练集样本进行特征提取。

步骤2:利用不同方式提取的特征集合进行分类实验。

表2不同特征提取模式的样本误分率

表2为三种特征提取模式在不同嵌入率情况下的样本误分率。可以看出,未 区分长短帧的特征提取模式(模式一)的误分率最高,按照帧类型对AAC音频划 分集合后(模式二)在各个相对嵌入率样本下都能有效的降低样本误分率,而对 AAC音频不同集合增加权值的方法(模式三)则能进一步提升分类效果,因此本 文所提出的基于AAC长短帧特性融合的策略是有效的。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是 对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不 脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发 明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号