首页> 中国专利> 基于边信息预测和直方图平移的数字音频可逆水印算法

基于边信息预测和直方图平移的数字音频可逆水印算法

摘要

本发明公开的基于边信息预测和直方图平移的数字音频可逆水印算法,包含以下步骤:计算该段音频数据的预测系数以及该样本的预测值;将预测值和该样本值相减,得到预测误差,再根据边信息预测算法的两种形式,建立两个不同的直方图,然后将水印信息嵌入到预测误差,得到含水印的预测误差;将含水印预测误差嵌入到目前样本的下一个样本值,得到含水印的音频值;在接收端接收含水印的音频信号,然后将预测值和样本值做差,利用预测误差直方图平移特性,提取嵌入信号,无损恢复原始音频信号。本发明的算法,与原有的预测算法相比,提升了预测的性能,而且还将非因果与直方图平移结合起来,在低嵌入率的时候,本发明具有较好的嵌入性能和较低失真率。

著录项

  • 公开/公告号CN106205627A

    专利类型发明专利

  • 公开/公告日2016-12-07

    原文格式PDF

  • 申请/专利权人 暨南大学;

    申请/专利号CN201610559953.0

  • 发明设计人 项世军;陈肇龙;

    申请日2016-07-14

  • 分类号G10L19/018;

  • 代理机构广州市华学知识产权代理有限公司;

  • 代理人陈宏升

  • 地址 510632 广东省广州市黄埔大道西601号

  • 入库时间 2023-06-19 01:03:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-18

    授权

    授权

  • 2017-01-04

    实质审查的生效 IPC(主分类):G10L19/018 申请日:20160714

    实质审查的生效

  • 2016-12-07

    公开

    公开

说明书

技术领域

本发明涉及音频数据处理领域,特别涉及基于边信息预测和直方图平移的数字音频可逆水印算法。

背景技术

音频可逆水印是多媒体信息安全和隐藏方向的一个重要分支,其特性主要有两个:第一个是水印可认证音频的完整性和真实性,并定位篡改;第二是载体可无损恢复,也就是说水印算法可逆。而可逆水印作为一种音频数据的处理方法,主要是将隐藏信息嵌入到音频里面,然后在接收端提取出隐藏信息,最后无损恢复音频值。

判断可逆水印嵌入算法的好坏标准,主要从几个方面来衡量:嵌入容量是指一段音频信号平均每比特所能嵌入的信息量;嵌入失真是指嵌入信息后音频信号的失真大小,通常用峰值信噪比来衡量,嵌入容量越大,嵌入失真越小,可逆水印嵌入算法越好。

现有好多种处理音频可逆水印的算法,如差值预测算法,此算法是最简单的数字音频预测算法,根据相邻样本之间的高度相关性,把前一个样本值当成是当前样本值的预测值,然后求出预测误差,再进行差分扩张嵌入。

差分预测只能利用到该音频数据的前一个数据,而忽视了该数据后一个数据与该音频值的相关性,而前后预测,一种简单的非因果预测,正好是利用到了该音频值的前后音频数据来预测该音频数据,该方法包括以下步骤:

步骤一:利用样本值的前后样本来预测当前样本,公式如下:

>xi=xi-1+xi+12>

步骤二:得出预测误差,然后再进行水印嵌入,得到含水印的音频信号。

上述针对前后预测应用到音频可逆水印,实现虽然简单,但还是存在以下几个难题和不足之处:

难题:

(1)当预测误差出现小数的时候,水印信息该如何嵌入去;

(2)嵌入水印后信息之后,如何保证含水印信息的音频样本仍然保持为整数形式;

(3)如何保持算法的可逆性;

不足之处:前后预测是将预测系数全设定为0.5,,得到的是该样本的前后两个样本值的平均值来预测,这预测出来的预测值的存在不高的精准度。

在嵌入方面,音频水印内现有的技术还提出很多种可行的方法,而使用的较为广泛的两种:一种是直方图平移方法,另一种是提升型LSB扩展嵌入方法。

直方图平移方法包括:首先建立音频的直方图,以幅值最多的点为基点,其他幅值点均平移一个单位,空出的位置就能嵌入小于等于基点幅值数目的水印信息。对于常见的音频,该算法具有较好的嵌入容量,但由于嵌入容量取决于具有与基点相同的幅值的数目,因此限制了其一般性。

提升型LSB扩展嵌入方法:主要思想是将整数和小数分开,只对整数部分进行扩展,对小数部分则是保持不变,如此一来,对于带有小数的数,都能进行水印嵌入,具体如下:

>mw=2×a+b+w=m+a+w,m02×a+b-w=m+a-w,m<0>

其中mw是含有水印信息的数,m是被嵌入的数,a该数的整数部分,b是该数的小数部分,w是嵌入水印。

但利用提升型LSB嵌入算法嵌入水印信息,会破坏相邻样本之间的大小关系,对于一些利用到几个相邻样本之间的大小关系来说,这是不太适用。

此外,现在技术中还提出一种相位编码的音频水印嵌入算法,利用人耳听觉系统对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印信息的参考相位替代原始音频段的绝对相位,并调整其余音频段以保持相对相位的不变。该算法利用了人耳的听觉特性,在嵌入信息后,原始音频数据是无法恢复的,即该算法不是数字音频可逆水印算法,不适用与某些对音频质量要求较高的场合。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供基于边信息预测和直方图平移的数字音频可逆水印算法,其可以更为精确,还能有效地减小预测误差带来的失真,提高水印算法的完整性认证,能够进一步解决前后预测所存在的不足和进一步提升非因果预测的预测效果。

本发明的目的通过以下的技术方案实现:

基于边信息预测和直方图平移的数字音频可逆水印算法,包含以下步骤:

1)通过计算机读取一段wav格式的音频数据,然后通过统计的方法计算该段音频数据的预测系数,即边信息,再结合该样本和该样本前后样本之间的大小关系,利用边信息预测算法,计算出该样本的预测值。

2)将预测值和该样本值相减,得到预测误差,再根据边信息预测算法的两种形式,建立两个不同的直方图,然后将水印信息通过直方图平移方式嵌入到预测误差,得到含水印的预测误差。

3)利用非因果预测算法的逆转变公式,将含水印预测误差嵌入到目前样本的下一个样本值,得到含水印的音频值。

4)在接收端接收含水印的音频信号,然后通过边信息预测算法,将预测值和样本值做差,利用预测误差直方图平移特性,提取嵌入信号,无损恢复原始音频信号。

所述步骤1),具体如下:

101、利用统计方法,求出该段音频信号的预测系数,如下公式:

>a=average(Σ2N-1ai)ai=min(|xi-xi-1|,|xi-xi+1|)|xi+1-xi-1|,if|xi+1-xi-1|0and>min(xi-1,xi+1)ximax(xi-1,xi+1)0.25,if|xi+1-xi-1|=00,otherwisea[0,0.5)i=2,3,4...>

其中,xi是第i个音频值,a是该段音频信号的预测系数,第i段音频信号的预测系数;“max()”函数功能是获得括号内最大的数,而“min()”函数功能是获得括号内最小的数。

102、根据边信息预测算法预测当前的音频值,公式如下:

>xi=xi-a×xi-1-(1-a)×xi+1,|xi-xi-1||xi-xi+1|xi-(1-a)×xi-1-a×xi+1,|xi-xi-1|<|xi-xi+1|>

其中,是第i个音频数据的预测值,从第二个音频数据开始,得到一系列的音频预测值。

所述步骤2),具体如下:

201、用当前的音频值减去该样本的预测值,得到当前音频数据的预测误差,公式如下:

>ei=xi-xi=xi-a×xi-1-(1-a)×xi+1,|xi-xi-1||xi-xi+1|i=2,3,4.....xi-(1-a)×xi-1-a×xi+1,|xi-xi-1|<|xi-xi+1|>

ei是第i个音频数据的预测误差,从第二个音频数据开始得到一系列的预测误差,保留第一第二个音频值和所有音频数据的预测误差。

202、利用直方图平移特性,将水印信息嵌入到预测误差,得到含水印的预测误差,公式如下:

>eiw=ei-sign(xi+1-xi-1)×Ta×w,a[-Ta2,Ta2)or(-Ta2,-Ta2]|xi-1-xi|<|xi+1-xi|ei+sign(ei)×Ta,otherwiseei+sign(xi+1-xi-1)×T1-a×w,a[-T1-a2,-T1-a2)or(-T1-a2,-T1-a2]|xi-1-xi||xi+1-xi|ei+sign(ei)×T1-a,otherwise>

>sign(x)=1,x>00,x=0-1,x<0>

>Ta=n×a,|xi-xi-1|<|xi-xi+1|T1-a=n×(1-a),|xi-xi-1||xi-xi+1|>

其中是第i个音频数据嵌入信息后的预测误差,“sign()”为符号函数,Ta和T1-a分别是|xi-xi-1|<|xi-xi+1|和|xi-xi-1|≥|xi-xi+1|这两种情况的其中是第i个音频数据嵌入信息后的预测误差,“sign()”为符号函数,Ta和T1-a分别是|xi-xi-1|<|xi-xi+1|和|xi-xi-1|≥|xi-xi+1|这两种情况的嵌入区域范围,w是嵌入水印信息,n是一个整数。

所述步骤3),具体如下:

>xi+1w=xi+1+sign(xi+1-xi-1)×n×w,ei[-Ta2,Ta2)or>ei(-Ta2,Ta2]|xi-1-xi|<|xi+1-xi|xi-1-sign(ei)×n,otherwisexi+1-sign(xi+1-xi-1)×n×w,if>ei[-T1-a2,T1-a2)or>ei(-T1-a2,T1-a2]|xi-1-xi|xi+1-xi|xi+1-sign(ei)×n,otherwise>

其中是第i+1个音频数据嵌入水印后的音频值。

所述步骤4),具体如下:

401、根据边信息预测算法,得出带有水印信息的音频值,公式如下:

>xwi=a×xi-1+(1-a)×xwi+1,|xi-xi-1||xi-xwi+1|or|xwi+1-xi-1|0i=2,3,4........(1-a)×xi-1+a×xwi+1,|xi-xi-1|<|xi-xwi+1|>

其中,是第i个带有水印的音频数据。

402、将音频值减去带有水印信息的预测值,得到带有水印的预测误差值,公式如下:

>eiw=xi-xiw=xi-a×xi-1-(1-a)×xi+1w,|xi-xi-1||xi-xi+1w|or|xi+1w-xi-1|ni=2,3,4...xi-(1-a)×xi-1-a×xi+1w,|xi-xi-1|<|xi-xi+1w|>

403、提取水印信息,恢复原始的预测误差和音频数据,公式如下:

>w=0,ewi[-Ta(T1-a)2,-Ta(T1-a)2)or(-Ta(T1-a)2,-Ta(T1-a)2]ewi[-3×Ta(T1-a)2,-3×Ta(T1-a)2)or(-3×Ta(T1-a)2,-3×Ta(T1-a)2]1,otherwise>

>ei=eiw,if>eiw[-Ta2,Ta2)or(-Ta2,Ta2]|xi-xi-1|<|xi-xi+1w|eiw-sign(eiw)×Ta,otherwiseeiw,if>eiw[-T1-a2,T1-a2)or(-T1-a2,T1-a2]|xi-xi-1||xi-xi+1w|or|xi+1w-xi-1|neiw-sign(eiw)×T1-a,otherwise>

根据所述无损恢复原始音频数据,具体如下:

>e2=x2-x2=x2-a×x1-(1-a)×x3×x3=x2-e2-a×x11-a,if|x2-x1||x2-x3|or|x3-x1|<nx2-(1-a)×x1-a×x3x3=x2-e2-(1-a)×x1a,if|x2-x1|<|x2-x3|e3=x3-x3=x3-a×x2-(1-a)×x4x4=x3-e3-a×x21-a,if|x3-x2||x3-x4|or|x4-x2|<nx3-(1-a)×x2-a×x4x4=x3-e3-(1-a)×x2a,|x3-x1|<|x3-x4|e4=x4-x4=x4-a×x3-(1-a)×x5x5=x4-e4-a×x31-a,if|x4-x3||x4-x5|or|x5-x3|<nx4-(1-a)×x3-a×x5x5=x4-e4-(1-a)×x3a,if|x4-x3|<|x4-x5|...en-2=xn-2-xn-2=xn-2-a×xn-3-(1-a)×xn-1xn-1=xn-2-en-2-a×xn-31-a,if|xn-2-xn-3||xn-2-xn-1|or|xn-1-xn-3|<nxn-2-(1-a)×xn-3-a×xn-1xn-1=xn-2-en-2-(1-a)×xn-3a,if|xn-2-xn-3|<|xn-2-xn-1|en-1=xn-1-xn-1=xn-1-a×xn-2-(1-a)×xnxn==xn-1-en-1-a×xn-21-a,if|xn-1-xn-2||xn-1-xn|or|xn-xn-2|<nxn-1-(1-a)×xn-2-a×xnxn=xn-1-en-1(1-a)×xn-2a,if|xn-1-xn-2|<|xn-1-xn|>

根据上述式子,最终得到下式:

>xi+1=xi+1w,if>eiw[-Ta2,Ta2)or(-Ta2,Ta2]|xi-xi-1|<|xi-xi+1w|xi+1w+sign(eiw)×n,otherwisexi+1w,if>eiw[-T1-a2,T1-a2)or(T1-a2,T1-a2]|xi-xi-1||xi-xi+1w|or|xi+1w-xi-1|nxi+1w+sign(eiw)×n,otherwise>

利用保留第一第二个原始音频数据以及得到一系列的预测误差,就能完全的恢复原始的音频数据。

本发明与现有技术相比,具有如下优点和有益效果:

1、本发明是基于前后预测算法的基础上,进一步研究得出了边信息预测算法,它利用了相邻三个样本之间的大小关系,对每个当前样本都提供了两种预测算法并根据具体的情况选取最适合的一种表达式。此外,本算法结合了统计,非因果以及边信息三个元素,提升了预测效果。

2、利用了加性直方图平移算法,实现了将水印信息嵌入到音频信号上,并结合边信息预测,解决了当前三个难题:第一是预测误差带有小数时的水印嵌入;第二是嵌入水印后音频数据如何保持整数型式;第三是如何保持算法的可逆性。

3、本发明所提出的算法是一次具有创新性和大胆的尝试,有效地提升预测效果、保证算法的可逆性,无损恢复音频值的性能,并在低嵌入率的时候,与现有的算法相比,具有较好的峰值信噪比和较低的失真。

附图说明

图1为本发明所述基于边信息预测和直方图平移的数字音频可逆水印算法的流程示意图。

图2为图1所述算法的嵌入流程示意图。

图3为图1所述算法的提取信息和恢复音频值的流程示意图。

图4为边信息预测算法的当前样本与该样本前后之间的大小关系示意图。

图5为本发明中的直方图平移嵌入算法示意图。

图6为Track1音频信号在不同算法上的效果对比图。

图7为Track2音频信号在不同算法上的效果对比图。

图8为Track3音频信号在不同算法上的效果对比图。

图9为Track4音频信号在不同算法上的效果对比图。

图10为Track5音频信号在不同算法上的效果对比图。

图11为Track6音频信号在不同算法上的效果对比图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

如图1,基于边信息预测和直方图平移的数字音频可逆水印算法,包含以下步骤:

步骤101,在计算机中通过matlab软件读取音频数据,然后再利用统计方法,计算出该段音频数据的预测系数,再利用边信息预测算法得出预测值,最后将样本值减去预测值得到预测误差。

步骤102,建立预测误差直方图,根据直方图平移特点嵌入水印信息,得到带有水印的预测误差。

步骤103,根据非因果预测算法的逆转变公式,将带有水印信息的预测误差嵌入到当前样本的后一个样本中,得到带有水印的音频数据。

步骤104,在接收端,利用相同形式的预测算法,获得正确的预测值和含水印的预测误差,结合直方图和非因果预测逆转变公式,提取水印和恢复音频数据。

如图2所示,本实施例的音频可逆水印处理方法中的边信息预测算法与直方图平移嵌入算法,包括以下步骤:

步骤201,利用统计方法计算出该段音频信号的预测系数;

跟前后预测算法最为显著的不同,就是本发明利用的统计学的方法计算出该段音频信号的预测系数,而不是简单粗略的将预测系数设定全为0.5,这样一来,大大减少的计算的时间,而且提高了预测值的精确度,具体如下:

>a=averge(Σ2N-1ai)ai=min(|xi-xi+1|,|xi-xi-1|)|xi+1-xi-1|,|xi+1-xi-1|0and>min(xi-1,xi+1)max(xi-1,xi+1)0.25,|xi+1-xi-1|=0i=2,3,4.....0,otherwise0.5[0,0.5)>

其中xi是第i个音频值,a是该段音频信号的预测系数,“max()”函数功能是获得括号内最大的数,而“min()”函数功能是获得括号内最小的数。

步骤202,求出预测值和得出含水印的预测误差;

本发明所提到的边信息预测算法提供了两种预测模式,在已经计算出的预测系数前提下,根据当前样本与该样本前后音频值之间的大小关系,选择出最为合适的一种预测模式来预测音频值,随之得到预测误差,至于嵌入水印,本发明采用了直方图平移方式嵌入,主要思路是将嵌入区间外的所以值均向左向右平移Ta或者T1-a,腾出来的空间就是嵌入水印后值所处的位置范围。

a)利用边信息预测求出当前样本值的预测值,如下公式:

>xi=a×xi-1+(1-a)×xi+1,|xi-xi-1||xi-xi+1|i=2,3,4.......(1-a)×xi-1+a×xi+1,|xi-xi-1||xi-xi+1|>

是第i个音频数据的预测值,从第二个音频数据开始,得到一系列的音频预测值。

b)将样本值减去预测值,得到预测误差,如下公式:

>ei=xi-xi=xi-a×xi-1-(1-a)×xi+1,|xi-xi-1||xi-xi+1|i=2,3,4........xi-(1-a)×xi-1-a×xi+1,|xi-xi-1|<|xi-xi+1|>

ei是第i个音频数据的预测误差,从第二个音频数据开始得到一系列的预测误差,保留第一第二个音频值和所有音频数据的预测误差。

下表列举出前后预测与边信息预测算法的效果对比,数据说明了后者预测的效果比前者优越:

绝对值均值:衡量预测误差的平均幅度大小,通常情况下,预测误差绝对值均值越小,则预测误差整体幅度越小,反之则预测误差整体幅度越大。

标准差:衡量预测误差的集中程度,标准差越小,则预测误差越集中,否则预测误差越分散。

c)将水印嵌入到预测误差,得到含水印的预测误差,如下公式:

>ewi=ei-sign(xi+1-xi-1)×Ta×w,ei[-Ta2,Ta2)or(-Ta2,-Ta2]|xi-xi-1|<|xi-xi+1|ei+sign(ei)×Ta,otherwiseei+sign(xi+1-xi-1)×T1-a×w,ei[-T1-a2,-T1-a2)or(-T1-a2,-T1-a2]|xi-xi-1|<|xi-xi+1|ei+sign(ei)×T1-a,otherwise>

其中是第i个音频数据嵌入信息后的预测误差,“sign()”为符号函数,Ta和T1-a分别是|xi-xi-1|<|xi-xi+1|和|xi-xi-1|≥|xi-xi+1|这两种情况的嵌入区域范围,w是嵌入水印信息,n是一个正整数。

步骤203,由含水印的预测误差得到含水印的音频值;

>xwi+1=xi+1-sign(xi+1-xi-1)×n×w,ei[-Ta2,Ta2)or(-Ta2,-Ta2]|xi-xi-1|<|xi-xi+1|xi+1+sign(ei)×n,otherwisexi+1-sign(xi+1-xi-1)×n×w,ei[-T1-a2,T1-a2)or(-T1-a2,T1-a2]|xi-xi-1||xi-xi+1|xi+1+sign(ei)×n,otherwise>

其中是第i+1个音频数据嵌入水印后的音频值。

如图3所示,本实施例的音频可逆水印处理方法中直方图提取水印信息和非因果预测算法逆算法恢复原始音频数据,包括以下步骤:

步骤301,根据接收端接收到的音频信号相邻三个的大小关系,通过非因果预测算法求出含水印的预测值,然后预测值和当前样本值相减,得到带有水印的预测误差,具体如下:

a)求出当前样本含有水印的预测值,如下式:

>xwi=a×xi-1+(1-a)×xwi+1,|xi-xi-1||xi-xi+1|or|xwi+1-xi-1|ni=2,3,4........(1-a)×xi-1+a×xi+1,|xi-xi-1|<|xi-xi+1|>

其中,是第i个带有水印的音频数据。

b)求出含有水印的预测误差:

>ei=xi-xwi=xi-a×xi-1-(1-a)×xwi+1,|xi-xi-1||xi-xi+1|or|xwi+1-xi-1|ni=2,3,4........xi-x(1-a)×xi-1-a×xi+1,|xi-xi-1|<|xi-xi+1|>

步骤302,建立预测误差直方图,根据直方图嵌入水印算法的规律,提取水印信息,如下式:

>w=0,ewi[-Ta(T1-a)2,-Ta(T1-a)2)or(-Ta(T1-a)2,-Ta(T1-a)2]ewi[-3×Ta(T1-a)2,-3×Ta(T1-a)2)or(-3×Ta(T1-a)2,-3×Ta(T1-a)2]1,otherwise>

步骤303,恢复原始的预测误差,如下式:

>ei=eiw,if>eiw[-Ta2,Ta2)or(-Ta2,Ta2]|xi-xi-1|<|xi-xi+1w|eiw-sign(eiw)×Ta,otherwiseeiw,if>eiw[-T1-a2,T1-a2)or(-T1-a2,T1-a2]|xi-xi-1||xi-xi+1w|or|xi+1w-xi-1|neiw-sign(eiw)×T1-a,otherwise>

步骤304,利用第一第二个原始音频数据以及一系列的预测数据恢复原始音频数据,如下式:

根据上述式子,可得到下式:

>xi+1=xi+1w,if>eiw[-Ta2,Ta2)or(-Ta2,Ta2]|xi-xi-1|<|xi-xi+1w|xi+1w+sign(eiw)×n,otherwisexi+1w,if>eiw[-T1-a2,T1-a2)or(T1-a2,T1-a2]|xi-xi-1||xi-xi+1w|or|xi+1w-xi-1|nxi+1w+sign(eiw)×n,otherwise>

利用保留第一第二个原始音频数据以及得到一系列的预测误差,就能完全的恢复原始的音频数据。

如图4所示,(1)-(4)是相邻三个样本值之间的大小关系,根据这大小关系选择合适的预测模式得出预测值,而且还为了保证算法可逆性,本图提供了四种情况下的平移,目的就是为了在接收端还能保持这种大小关系。

如图5所示,是本发明的直方图平移图示,上图是原来模样,下图是平移之后腾空出来的位置。

如图6-11,所示,为本实施例通过六段不同的音频信号,实现边信息预测算法与直方图平移算法对比现有的音频可逆水印算法效果图,图中各算法为:

Noncausal[35]:基于前后预测误差的扩展算法

SHORTEN算法[36]:基于SHORTEN的预测误差扩展算法

Tian[6]:Tian的样本对嵌入算法

由此可见,本实施例的边信息预测算法与直方图平移算法在低嵌入率上,效果比另外几种有一定程度上的提升。

本实施例的音频数据处理方法结合了非因果预测,边信息,统计学三种元素在一起,并成功的将非因果预测运用在直方图平移上,解决了非因果预测一直存在的三个难题,保证的算法的可逆性,提高预测算法的预测性能,并经过试验测量出来的数据验证,本发明所运用的边信息预测算法比前后预测算法预测性能上要好,在低嵌入率的情况下,本发明比现有的几种算法都有一定程度上的提升。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号