法律状态公告日
法律状态信息
法律状态
2015-05-20
未缴年费专利权终止 IPC(主分类):G10L19/00 授权公告日:20110921 终止日期:20140401 申请日:20090401
专利权的终止
2011-09-21
授权
授权
2009-10-28
实质审查的生效
实质审查的生效
2009-09-02
公开
公开
技术领域
本发明涉及一种基于过零率的时间尺度不变的鲁棒音频水印方法,尤其是适用于数字音频版权保护,并能有效抵抗重采样形式时间尺度修改的鲁棒音频水印方法。
背景技术
近年来,随着计算机网络技术和多媒体技术的飞速发展,人们提出了相当多的音频水印方法用于音频数据的版权保护。然而,同步攻击问题至今仍是音频水印领域中的热点和难点问题。同步攻击主要包括剪切(Cropping)和时间尺度修改(Time-Scale Modification,TSM)两种方式。相对剪切而言,时间尺度修改可以在不改变音频质量和感知性的前提下,拉伸或缩短音频信号的长度,对嵌入在音频信号中的水印信息破坏性更大。时间尺度修改主要包括保持音调不变的时间尺度修改和重采样形式的时间尺度修改两种形式。文献“Audio watermarking bytime-scale modification”(M.Mansour,A.Tewfik,IEEE International Conference onAcoustics,Speech and Signal Processing,vol.3,pp.1353-1356,2001)和文献“Dataembedding in audio using time-scale modification”(M.Mansour,A.Tewfik,IEEETransactions on Speech Audio Process,vol.13,no.3,pp.432-440,2005)通过修改平滑波形连续的两个局部峰值点之间的相对长度,提出了一种能够抵抗时间尺度修改的鲁棒音频水印方法,该方法的复杂度较高,性能主要取决于阈值的选择。在文献“An audio watermarking method robust against time and frequency fluctuation”(R.Tachibana,S.Shimizu,Proceedings of SPIE Security and Watermarking ofMultimedia Contents III,vol.4314,pp.104-115,2001)的基础上,文献“Improvingaudio watermarking robustness using stretched patterns against geometric distortion”(R.Tachibana,Proceedings of IEEE International Conference on Multimedia,pp.647-654,2002.)通过使用多重伪随机数组将抵抗时间尺度修改的性能提高到±8%,但是其性能仍然依赖于某些参数的调整。文献“Localized audiowatermarking technique robust against time-scale modification”(W.Li,X.Y.Xue,P.Z.Lu,IEEE Transactions on Multimedia,vol.8,no.1,pp.60-69,2006)将水印嵌入在感知重要的局部区域,该方法抵抗保持音调不变的时间尺度修改攻击为±15%,但是该方法只适用于某些特定的音乐。文献“Histogram-based audiowatermarking against time-scale modification and cropping attacks”(S.J.Xiang,J.W.Huang,IEEE Transactions on Multimedia,vol.9,no.7,pp.1357-1372,2007)利用音频信号直方图和绝对均值,提出了一种能有效抵抗时间尺度修改±30%的鲁棒音频水印方法,然而该方法对有损压缩等常规信号处理攻击的鲁棒性较弱。因此,研究一种复杂度较低,适用于所有类型的音频信号,且对常规音频信号处理操作和时间尺度修改鲁棒性均较强的音频水印方法,具有重要的现实意义。
发明内容
本发明的目的在于提供一种基于过零率的鲁棒音频水印方法,该方法算法简单、适用于所有类型的音频信号,它不仅能够有效抵抗常规信号处理攻击(如:叠加噪声、有损压缩、低通滤波、重新采样等),而且对重采样形式的时间尺度修改也具有很强的鲁棒性。
本发明目的是通过如下的手段实现的。
基于过零率的时间尺度不变的鲁棒音频水印方法,在于水印嵌入过程包括如下具体步骤:首先将原始音频信号A分成许多不重叠的音频帧;然后计算各音频帧的过零率,根据预置阈值T选择过零率较大的M1个音频帧用于嵌入水印;将所述M1个音频帧每个分成多个不重叠的音频段,所述不重叠的音频段的数量与待嵌入水印的总比特数一致,量化不重叠的音频段样本的平均值以嵌入水印比特,修改各音频段对应的样本值,获得含水印的音频段;最后相互连接各含水印的音频段获得含水印音频帧,以构成最终的含水印音频。
与现有的音频水印算法相比,本发明充分利用了过零率这一在重采样形式时间尺度修改前后近似稳定的特征,对过零率较大的音频帧利用量化方法嵌入水印。这样既能保证对常规音频信号处理攻击的鲁棒性,又能充分的抵抗重采样形式的时间尺度修改。
本发明方法包括水印嵌入和水印提取两个部分,水印嵌入部分主要步骤如下:
1、将原始音频信号A={a(i)|1≤i≤L}划分成N帧,表示为Aj|j=1,K,N。
2、计算各音频帧的过零率,表示为Zj|j=1,K,N。
3、选择过零率最大的M1个音频帧用于嵌入水印,记此M1个音频帧中最小的过零率为ZCR1,其余N-M1个音频帧中最大的过零率为ZCR2,应满足这样的条件,即ZCR1-ZCR2≥T。这里,T是预置的阈值。
4、对M1个音频帧中的一帧PA1嵌入水印。先将PA1划分成N1个互不重叠的音频段,表示为PA1(i)|i=1,K,N1,这里N1是待嵌入水印总比特数;然后量化各音频段样本的平均值逐次嵌入水印比特。
5、对其余的M1-1个音频帧进行步骤4相同的操作,以嵌入水印。
水印提取的主要步骤如下:
1、将含水印音频信号A*划分成N帧,表示为A*j|j=1,K,N。
2、计算各音频帧的过零率,表示为Z*j|j=1,K,N。
3、选择过零率最大的M1个音频帧用于提取水印。
4、从M1个音频帧中的一帧PA1*提取水印。先将PA1*划分成N1个互不重叠的音频段,表示为PA1*(i)|i=1,K,N1,这里N1是待提取水印总比特数;然后从各音频段样本的平均值逐次提取水印比特。
5、对其余的M1-1个音频帧进行步骤4相同的操作,以提取水印。
6、按照多数规则,从提取的M1个水印中获得最终的鲁棒水印。
附图说明如下
图1为本发明水印嵌入过程部分框图。
图2为本发明水印提取过程部分框图。
图3本发明实施例原始音频信号图
图4本发明实施例嵌入水印后的含水印音频信号图
图5本发明实施例含水印音频信号经受信号处理攻击的水印误比特数表1。
图6本发明实施例含水印音频信号经受信号处理攻击的水印误比特数表2。
具体实施方式
下面结合附图对本发明的内容作进一步的详述。
1、水印嵌入:如图1流程进行水印的嵌入。
(1)将原始音频信号A={a(i)|1≤i≤L}划分成N帧,表示为Aj|j=1,K,N,原始音频信号如图3所示。
(2)计算各音频帧的过零率,表示为Zj|j=1,K,N。
(3)选择过零率最大的M1个音频帧用于嵌入水印,记此M1个音频帧中最小的过零率为ZCR1,其余N-M1个音频帧中最大的过零率为ZCR2,应满足这样的条件,即ZCR1-ZCR2≥T。其中,T是预置的阈值,这里T=0.05,M1=3。
(4)对M1个音频帧中的一帧PA1嵌入水印。先将PA1划分成N1个互不重叠的音频段,表示为PA1(i)(j)|i=1,K,N1,j=1,K,N2,这里N1是待嵌入水印总比特数,此实施例取N1=60,表示取下整;采用文献“Digitalwatermarking for telltale tamper proofing and authentication”(D.Kundur,D.Hatzinakos,Proc.IEEE,vol.87,no.7,pp.1167-1180,1999)的量化方法量化各音频段样本的平均值逐次嵌入水印比特,嵌入水印比特细节如下:
这里,S是量化步长,mod(x,y)表示取x除以y的余数,w(i)是待嵌入的水印比特。表示修改后的音频段样本平均值。按如下的方式修改各样本:
(5)对其余的M1-1个音频帧进行步骤4相同的操作,以嵌入水印。图4所示是嵌入水印后的含水印音频信号。
2、水印提取:如图2流程进行水印的提取。在对水印进行验证时的方法为所述水印嵌入过程类似相逆,即,首先将待检测音频信号A*分成许多不重叠的音频帧;然后计算各音频帧的过零率,选择过零率较大的M1个音频帧用于提取水印;将各被选择的音频帧分成许多不重叠的音频段,音频段的数量与待提取水印的总比特数一致,从各音频段样本的平均值提取水印比特;按照多数规则,从提取的M1个水印中获得最终的鲁棒水印W*。具体步骤为:
(1)将含水印音频信号A*划分成N帧,表示为A*j|j=1,K,N。
(2)计算各音频帧的过零率,表示为Z*j|j=1,K,N。
(3)选择过零率最大的M1个音频帧用于提取水印。
(4)从M1个音频帧中的一帧PA1*提取水印。先将PA1*划分成N1个互不重叠的音频段,表示为PA1*(i)|i=1,K,N1,这里N1是待提取水印总比特数;然后从各音频段样本的平均值逐次提取水印比特,其细节如下:
(5)对其余的M1-1个音频帧进行步骤4相同的操作,以提取水印Wi|i=2,K,M1。
(6)按照多数规则,从提取的M1个水印中获得最终的鲁棒水印W*。
本发明方法的效果可以通过以下的性能分析验证:
1、不可感知性
如图3所示是一采样率为44.1kHz,样本长度为600000,WAVE格式的音频信号;图4所示是嵌入水印后的含水印音频信号,其信噪比SNR为34.6835dB。
2、鲁棒性
如图4所示的含水印音频信号经受各种信号处理攻击后,提取的水印误比特数如图5和图6所示。结果表明本发明提出的新方法不仅能够有效抵抗常规信号处理攻击,而且对重采样形式的时间尺度修改也具有很强的鲁棒性。
机译: 基于双谱不变性的基于特征的鲁棒图像水印方案
机译: -使用双特征不变性的基于特征的鲁棒图像水印方案
机译: 基于多分辨率分析的鲁棒运动水印插入与分析方法