首页> 中国专利> 一种针对音频扩频隐写的隐写分析方法

一种针对音频扩频隐写的隐写分析方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及信息隐藏检测技术领域，尤其涉及一种针对音频扩频隐写的隐写分析方法。本发明主要考察重复嵌入引起的信号在统计上的差异，在小波域中引入高斯混合模型对小波子带系数进行建模，计算信号与第一次隐写信号，第一次隐写信号与第二次隐写信号的统计距离作为特征值，最后采用支持向量机为分类器构造隐写分析算法。本发明性能稳健，检测正确率高，虚警率和漏检率低，而且该方法使用简单，时间复杂度低，可应用于隐秘信息检测领域，对防止非法的隐蔽通信具有重要的意义。

著录项

公开/公告号CN102063907A

专利类型发明专利
公开/公告日2011-05-18

原文格式PDF
申请/专利权人武汉大学;
展开▼

申请/专利号CN201010504101.4
发明设计人胡瑞敏;曾伟;艾浩军;
展开▼

申请日2010-10-12
分类号G10L19/02(20060101);
代理机构武汉科皓知识产权代理事务所(特殊普通合伙);
代理人张火春
地址 430072 湖北省武汉市武昌区珞珈山
入库时间 2023-12-18 02:21:58

法律信息

法律状态公告日

法律状态信息

法律状态
2015-12-09

未缴年费专利权终止 IPC(主分类):G10L19/02 授权公告日:20120704 终止日期:20141012 申请日:20101012

专利权的终止
2012-07-04

授权

授权
2011-07-20

实质审查的生效 IPC(主分类):G10L19/02 申请日:20101012

实质审查的生效
2011-05-18

公开

公开

说明书

技术领域

本发明涉及信息隐藏检测技术领域，尤其涉及一种针对音频扩频隐写的隐写分析方法。

背景技术

在音频信息隐藏中，基于扩频通信思想的隐藏算法因其鲁棒性强，对噪声具有很好的免疫力而受到广泛的关注。因此，对扩频隐写进行有效、准确而又可靠的检测，对于保护信息安全、防止隐秘通信有着十分重要的意义。

近年来，关于扩频隐写的隐写分析方法也相继报道。Fraid(参见文献1)提出了基于小波系数高阶统计量和支持向量机的检测算法。针对EzStego、OoutGuess和Jsteg的实验结果表明了所选择统计量的有效性。在Fraid研究的基础上，McBride(参见文献2)提出基于高维几何分类器的检测方法。Hamza(参见文献3)提出了一种基于音频质量和分类器的音频隐写分析方法，但检测的准确性直接决定于音频数据库中对音频质量指标的训练结果，使其可靠性和精确性受限而且算法实现的计算量很大。Altun(参见文献4)提出了基于形态学失真的隐写分析方法，并对加性高斯白噪声进行了检测。Sullivan(参见文献5)通过考察图像像素间的相关性，使用优化的假设检验方法实现扩频隐写分析。Harmsen(参见文献6)建立了通用的加性噪声隐写分析模型，但是仅仅利用直方图特征函数质心进行有无秘密数据的判断，其准确率不太理想。

文献1：Hany Farid.Detecting Hidden Messages Using Higher-Order Statistical Models.in Proceedings of the IEEE International Conference on Image Processing，2002，Vol 2，pp.905～908.

文献2：McBride B T，Peterson G L，Gustafson S C.A new blind method for detecting novel steganography.Digital Investigation，2005(2)：50-70.

文献3：Hamza O，Ismail A，Bulent S et al.Steganalysis of audio based on audio quality metrics.in Proceedings of SPIE on Security and Watermarking of Multimedia Contents，2003，pp.55-66.

文献4：Altun O，Sharma G，Celik M，Bocko M.Morphological steganalysis of audio signals and the principle of diminishing marginal distortions.in Proceedings of IEEE International Conference on Acoustics，Speech，and Signal Processing，2005，pp.21-24.

文献5：K.Sullivan，U.Madhow，S.Chandrasekaran，B.S.Manjunath.Steganalysis of spread spectrum data hiding exploiting cover memory.in Proc.IST/SPIE 17^th Annu.Symp.Electronic Imaging Science Technology，2005，pp.38-46.

文献6：J.J.Harmsen，W.A.Pearlman.Steganalysis of additive noise modelable information hiding.in Proc.SPIE，Electronic Imaging Security and Watermarking of Multimedia Contents，January 2003，pp.131-142.

发明内容

针对上述存在的技术问题，本发明的目的是提供一种针对音频扩频隐写的隐写分析方法，能够对秘密信息嵌入，实现高质量的检测，其正确率高，具有广泛的适用性。

为达到上述目的，本发明采用如下的技术方案：

特征值提取步骤包括以下步骤：

①设载体音频文件用X[i]表示，隐写音频用Y[i]表示，对隐写音频再进行扩频隐写，得到的第二次隐写音频用Z[i]表示，其中1≤i≤I，I为信号长度；

对载体音频和隐写音频以及第二次隐写音频进行分帧处理，帧长为N，载体音频的帧信号用x_n[i]表示，隐写音频的帧信号用y_n[i]，第二次隐写音频的帧信号用z_n[i]表示，其中，1≤i≤N，

②根据步骤①得到的帧信号，随机选择m帧进行分析，对每帧信号进行一级离散小波变换，然后提取第一级细节子带，其中

载体信号的小波系数用DX_n[i]表示，隐写音频的小波系数用DY_n[i]表示，第二次隐写音频的小波系数用DZ_n[i]表示，其中1≤i≤CL，CL为小波子带的长度，1≤n≤m；

③根据步骤②得到的帧信号的小波细节子带系数，分别采用高斯混合模型对其训练建模；通过最大期望值算法计算得到高斯混合模型的分量参数：均值，协方差，权重；

④根据步骤③计算得到的混合高斯模型参数计算载体音频帧信号概率分布PD_x(n)与隐写音频帧信号概率分布PD_y(n)的距离，隐写音频帧信号概率分布PD_y(n)与第二次隐写音频帧信号概率分布PD_z(n)之间的距离，1≤n≤m。距离测量采用如下距离公式：

$D_{1} (n) = - \log [\frac{2 \underset{i, j}{Σ} π_{x} (i) π_{y} (j) \sqrt{\frac{| {(V_{1})}_{ij} |}{e^{{(k_{1})}_{ij}} | Σ_{x} (i) | | Σ_{y} (j) |}}}{\underset{i, j}{Σ} π_{x} (i) π_{x} (j) \sqrt{\frac{| {(V_{1})}_{ij} |}{e^{{(k_{1})}_{ij}} | Σ_{x} (i) | | Σ_{x} (j) |}} + \underset{i, j}{Σ} π_{y} (i) π_{y} (j) \sqrt{\frac{| {(V_{1})}_{ij} |}{e^{{(k_{1})}_{ij}} | Σ_{y} (i) | | Σ_{y} (j) |}}}]$

$D_{2} (n) = - \log [\frac{2 \underset{i, j}{Σ} π_{y} (i) π_{z} (j) \sqrt{\frac{| {(V_{2})}_{ij} |}{e^{{(k_{2})}_{ij}} | Σ_{y} (i) | | Σ_{z} (j) |}}}{\underset{i, j}{Σ} π_{y} (i) π_{y} (j) \sqrt{\frac{| {(V_{y})}_{ij} |}{e^{{(k_{y})}_{ij}} | Σ_{y} (i) | | Σ_{y} (j) |}} + \underset{i, j}{Σ} π_{z} (i) π_{z} (j) \sqrt{\frac{| {(V_{2})}_{ij} |}{e^{{(k_{2})}_{ij}} | Σ_{z} (i) | | Σ_{z} (j) |}}}]$

(V₁)_ij＝((∑_x(i))^-1+(∑_y(j))^-1)^-1

其中，

(k₁)_ij＝(μ_x(i))^T(∑_x(i))^-1(μ_x(i)-μ_y(j))+(μ_y(j))^T(∑_y(j))^-1(μ_y(j)-μ_x(i))

(V₂)_ij＝((∑_y(i))^-1+(∑_z(j))^-1)^-1

(k₂)_ij＝(μ_y(i))^T(∑_y(i))^-1(μ_y(i)-μ_z(j))+(μ_z(j))^T(∑_z(j))^-1(μ_z(j)-μ_y(i))

其中，n表示第n个特征值。i和j分别表示高斯混合模型的第i个和第j个分量；μ_x(i)，∑_x(i)，π_x(i)分别为载体音频第i个高斯分量的均值，协方差以及权重；μ_y(i)，∑_y(i)，π_y(i)分别为第一次隐写音频第i个高斯分量的均值，协方差以及权重；μ_z(i)，∑_z(i)，π_z(i)分别为第二次隐写音频第i个高斯分量的均值，协方差以及权重；

⑤根据步骤④将计算得出距离值D₁(n)和D₂(n)，(1≤n≤m)作为支持向量机的特征值，用于分类器的训练。

SVM训练模型的生成步骤包括以下步骤：

将t个干净样本及其扩频隐写样本进行特征值提取，分别表示为：

FX(i)＝{X_iD₁(n)，X_iD₂(n)}，FY(i)＝{Y_iD₁(n)，Y_iD₂(n)}，其中，1≤i≤t，X_iD₁(n)和X_iD₂(n)表示第i个载体样本的特征值，Y_iD₁(n)和Y_iD₂(n)表示第i个隐写样本的特征值，1≤n≤m，m为所选分析帧的个数；

将t个特征值结合FX和FY作为输入变量输入到支持向量机中，生成分类器模型。

扩频隐写分析步骤包括以下步骤：

给定s个待测音频信号，提取特征值，表示为：FZ(i)＝{Z_iD₁(n)，Z_iD₂(n)}，其中，1≤i≤s，Z_iD₁(n)和Z_iD₂(n)表示第i个待测音频样本的特征值，1≤n≤m，m为所选分析帧的个数；

将s个特征值FZ输入到分类器模型，分类器自动判别得出s个待测音频信号是否为隐写信号。

本发明具有以下优点和积极效果：

1)本发明具有较高正确率，低虚警率和漏检率，对多种类型的音频文件测试，性能稳健；

2)本发明算法复杂性低、计算开销小。

附图说明

图1是本发明中特征值提取的流程图。

图2是本发明中SVM训练模型图。

图3是本发明中检测模型图。

具体实施方式

下面以具体实施例结合附图对本发明作进一步说明：

本发明提供的针对音频扩频隐写的隐写分析方法中心思想为：中心思想是经过重复隐写，第一次嵌入引起的信号失真最大，然后随之减小。相邻两个信号间的统计失真距离会变得越来越小。考察信号在小波域上小波子带的噪声分布，然后选择合适的概率模型对其建模，计算有效的距离测量作为特征值，最后采用支持向量机构造隐写分析算法。

算法的实施采用模式识别的思想，在训练阶段：首先对干净样本及其相应的隐写样本提取特征值，特征值提取步骤如附图1所示。然后将干净样本和隐写样本的特征值输入到SVM分类器中进行训练得到分类器模型，如附图2所示。在测试阶段，如附图3所示，给定一个待检测样本，首先按照如附图1所示的方法提取特征值，然后将特征值输入到分类器中，结合训练阶段得到的分类器模型，分类器计算得到分类器结果，判断该待测样本是否为隐写样本。

一、特征值的提取

①设载体音频文件用X[i]表示，隐写音频用Y[i]表示，对隐写音频再进行扩频隐写，得到的第二次隐写音频用Z[i]表示，其中1≤i≤I，I为信号长度；

②根据步骤①得到的帧信号，随机选择m帧进行分析，对每帧信号进行一级离散小波变换，然后提取第一级细节子带，其中载体信号的小波系数用DX_n[i]表示，隐写音频的小波系数用DY_n[i]表示，第二次隐写音频的小波系数用DZ_n[i]表示，其中1≤i≤CL，CL为小波子带的长度，1≤n≤m；

本步骤中离散小波变换、第一级细节子带均为信号处理领域的常用名词，属于公知的技术手段，在此不予详细描述。

③根据步骤②得到的帧信号的小波细节子带系数，分别采用高斯混合模型对其训练建模；通过最大期望值算法计算得到高斯混合模型的分量参数：均值，协方差，权重。

高斯混合模型(GMM)被用于多分量分布模型的建模，在训练GMM模型时，常常采用成熟的最大期望值(EM)算法来估计模型参数。GMM是K个成员的高斯概率密度的加权和，可以表示为：

$p (x | λ) = Σ_{i = 1}^{K} π_{i} p_{i} (x);$ $Σ_{i = 1}^{K} π_{i} = 1$

这里，x是D维随机变量；p_i(x)(i＝1，2，...，K)是每个成员的高斯概率密度函数；π_i(i＝1，2，...，K)是高斯分量的权重。完整的GMM可以表示为：λ_i＝{π_i，μ_i，∑_i}(i＝1，2，...，K)。

对于一个长度为T的信号序列X＝(x₁，x₂，...，x_T)，其GMM似然概率为：

$P (X | λ_{i}) = Π_{i = 1}^{T} p (x_{i} | λ_{i})$

EM算法的基本思想是从模型参数λ的一个初值开始，估计出一个新的参数使得新的模型参数下的似然概率新的模型参数再作为当前参数进行训练，这样迭代运算直到模型收敛。

利用EM算法分别对载体音频，第一次隐写音频，第二次隐写音频的小波子带系数进行高斯混合模型参数的估算。设载体音频的分量参数分别表示为(μ_x(i)，∑_x(i)，π_x(i))，隐写音频的分量参数表示为(μ_y(i)，∑_y(i)，π_y(i))，第二次隐写音频的分量数参数表示为(μ_z(i)，∑_z(i)，π_z(i))，其中1≤i≤K，K为高斯分量数；

(V₁)_ij＝((∑_x(i))^-1+(∑_y(j))^-1)^-1

其中，

(k₁)_ij＝(μ_x(i))^T(∑_x(i))^-1(μ_x(i)-μ_y(j))+(μ_y(j))^T(∑_y(j))^-1(μ_y(j)-μ_x(i))

(V₂)_ij＝((∑_y(i))^-1+(∑_z(j))^-1)^-1

(k₂)_ij＝(μ_y(i))^T(∑_y(i))^-1(μ_y(i)-μ_z(j))+(μ_z(j))^T(∑_z(j))^-1(μ_z(j)-μ_y(i))

其中，n表示第n个特征值。i和j分别表示高斯混合模型的第i个和第j个分量；μ_x(i)，∑_x(i)，π_x(i)分别为载体音频第i个高斯分量的均值，协方差以及权重。μ_y(i)，∑_y(i)，π_y(i)分别为第一次隐写音频第i个高斯分量的均值，协方差以及权重。μ_z(i)，∑_z(i)，π_z(i)分别为第二次隐写音频第i个高斯分量的均值，协方差以及权重。

⑤根据步骤④将计算得出距离值D₁(n)和D₂(n)，(1≤n≤m)作为支持向量机的特征值，用于分类器的训练。

二、SVM训练模型的生成

检测音频信号中是否含有隐秘信息可看作是一个数据分类问题。我们选用性能出色的支持向量机(Support Vector Machines，SVM)作为分类器。支持向量机是一种高性能的机器学习算法，它起源于统计学习理论，基于结构风险最小化原理(Structural Risk Minimization Principle，SRM)，针对两类分类问题，在高维空间中寻找一个超平面作为两类的分割，以保证最小的分类错误率。通过使用非线性核函数将输入数据映射到高维特征向量空间来构建非线性分类器。常用的核函数有线性，多项式，径向基函数和sigmoid核函数。

支持向量机从线性可分情况下的最优分类面发展而来。设H为分类线，H₁、H₂分别为过各类中离分类线最近的样本且平行于分类线的直线，它们之间的距离称为分类间隔。最优分类线是要求分类线不但能将两类正确分开，而且使分类间隔最大。分类线的方程为x·w+b＝0，对其进行归一化，使得线性可分的样本集(x_i，y_i)，其中i＝1，K，n，x∈R^d，y∈{+1，-1}，满足：

y_i[(w·x_i)+b]-1≥0，i＝1，K，n

此时分类间隔等于2/||w||，使间隔最大等价于使||w||²最小。满足上式且使||w||²/2最小的分类面叫做最优分类面。H₁、H₂上的训练样本点称为支持向量。利用Lagrange优化方法把上述最优分类面问题转化为对偶问题，即在约束条件下：

$Σ_{i = 1}^{n} y_{i} α_{i} = 0, α_{i} \geq 0, i = 1, K, n$

对α_i求解下列函数的最大值：

$Q (α) = Σ_{i = 1}^{n} α_{i} - \frac{1}{2} Σ_{i, j = 1}^{n} α_{i} α_{j} y_{i} y_{j} (x_{i} \cdot x_{j})$

其中，α_i为原问题中与约束条件对应的Lagrange乘子。问题转化为在不等式约束条件下二次函数寻优的问题，存在唯一解。解中只有少部分α_i不为零，对应的样本就是支持向量。求解上述问题后得到的最优分类函数是：

$f (x) = sgn {(w \cdot x) + b} = sgn {Σ_{i = 1}^{n} α_{i}^{*} y_{i} (x_{i} \cdot x) + b^{*}}$

其中，b^*是分类阈值，可以用任一个支持向量求得，或通过两类中任意一对支持向量取中值求得。

对于非线性问题，可以通过非线性变换转化为某个高维空间中的线性问题，在变换空间中求最优分类面。设有非线性映射Φ：R^d→H将输入空间的样本映射到高维的特征空间H中。当在特征空间H中构造最优超平面时，训练算法仅使用空间中的点积，即Φ(x_i)·Φ(x_j)，而没有单独的Φ(x_i)出现。因此，如果能找到一个函数K使得K(x_i，x_j)＝Φ(x_i)·Φ(x_j)，这样，在高维空间就只需要内积运算，而这种内积运算是可以用原空间中的函数实现的，而不需要知道变换Φ(·)的形式。根据泛函的相关理论，只要核函数K(x_i，x_j)满足Mercer条件，它就对应于某一变换空间的内积。因此在最优分类面中采用适当的内积函数K(x_i，x_j)就可以实现某一非线性变换后的线性分类，而不会增加计算复杂度，此时目标函数变为：

$Q (α) = Σ_{i = 1}^{n} α_{i} - \frac{1}{2} Σ_{i, j = 1}^{n} α_{i} α_{j} y_{i} y_{j} K (x_{i} \cdot x_{j})$

相应的分类函数也变为：

$f (x) = sgn (Σ_{i = 1}^{n} α_{i}^{*} y_{i} K (x_{i}, x) + b^{*})$

这里函数K(·)称为点积的卷积核函数。

将t个干净样本及其扩频隐写样本按照步骤一进行特征值提取，分别表示为：FX(i)＝{X_iD₁(n)，X_iD₂(n)}，FY(i)＝{Y_iD₁(n)，Y_iD₂(n)}，其中，1≤i≤t，X_iD₁(n)和X_iD₂(n)表示第i个载体样本的特征值，Y_iD₁(n)和Y_iD₂(n)表示第i个隐写样本的特征值，1≤n≤m，m为所选分析帧的个数。将t个特征值结合FX和FY作为输入变量输入到支持向量机中，生成分类器模型。

三、扩频隐写分析

给定s个待测音频信号，按照步骤一所述特征值提取的方法提取特征值，表示为：FZ(i)＝{Z_iD₁(n)，Z_iD₂(n)}，其中，1≤i≤s，Z_iD₁(n)和Z_iD₂(n)表示第i个待测音频样本的特征值，1≤n≤m，m为所选分析帧的个数。将s个特征值FZ输入到步骤二中生成的分类器模型，分类器自动判别得出s个待测音频信号是否为隐写信号。

以上实施例仅供说明本发明之用，而非对本发明的限制，有关技术领域的技术人员，在不脱离本发明的精神和范围的情况下，还可以作出各种变换或变型，因此所有等同的技术方案，都落入本发明的保护范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种针对音频扩频隐写的隐写分析方法 [P] . 中国专利： CN102063907B . 2012.07.04
2. 一种针对MP3Stego隐写后的音频的隐写检测方法 [P] . 中国专利： CN104282310B . 2017.05.03
3. Spread spectrum image steganography [P] . 美国专利： US6557103B1 . 2003-04-29

机译：扩频图像隐写术
4. POSITIONING SYSTEM AND METHOD WITH STEGANOGRAPHIC ENCODED DATA STREAMS IN AUDIBLE-FREQUENCY AUDIO [P] . 美国专利： US2018238994A1 . 2018-08-23

机译：音频音频中具有隐写编码数据流的定位系统和方法
5. POSITIONING SYSTEM AND METHOD WITH STEGANOGRAPHIC ENCODED DATA STREAMS IN AUDIBLE-FREQUENCY AUDIO [P] . 欧洲知识产权局专利： EP3262435A1 . 2018-01-03

机译：音频音频中具有隐写编码数据流的定位系统和方法