首页> 中国专利> 在数字音频信号中嵌入和检测水印的方法

在数字音频信号中嵌入和检测水印的方法

摘要

本发明涉及用于在数字音频信号中嵌入并检测水印的方法。为了在数字音频信号中嵌入水印,根据选择的数字音频信号的输入段(sin (t))生成修改段(sout (t))。创建修改段(sout (t)),并将输入段(sin (t))的两个子段(ssub,1 (t),ssub,2 (t))中的至少一个时移(dt),以使在重叠区域(Lov)中这两个子段(ssub,1 (t),ssub,2 (t))的相关值最大、所述重叠区域(Lov)中的信号(sov (t))是所述重叠区域中这两个子段(ssub,1 (t),ssub,2 (t))的加权平均。为了在接收的数字音频信号(x(t))中检测嵌入的水印,生成第一模板信号(h1(t))和第二模板信号(h2(t))。通过将所述第一和第二模板信号(h1(t))和(h2(t))与接收到的数字音频信号(x(t))比较来创建第一和第二相关值(c1和c2)。最后,在第二相关值(c2)高于第一相关值(c1)时,假定该接收的数字音频信号中含有水印。

著录项

  • 公开/公告号CN1742332A

    专利类型发明专利

  • 公开/公告日2006-03-01

    原文格式PDF

  • 申请/专利权人 艾利森电话股份有限公司;

    申请/专利号CN03826002.6

  • 发明设计人 N·费伯;F·哈通;

    申请日2003-02-21

  • 分类号G11B20/00(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人杨凯;刘杰

  • 地址 瑞典斯德哥尔摩

  • 入库时间 2023-12-17 17:08:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-04-27

    未缴年费专利权终止 IPC(主分类):G11B20/00 授权公告日:20080806 终止日期:20100221 申请日:20030221

    专利权的终止

  • 2008-08-06

    授权

    授权

  • 2006-04-26

    实质审查的生效

    实质审查的生效

  • 2006-03-01

    公开

    公开

说明书

本发明涉及用于在数字音频信号中嵌入和检测水印的方法。

现有技术中,将水印用于数字媒体(如视频或音频)的数字版权管理。水印是隐藏在媒体或宿主数据中的数字信息,理想情况下它是不可察觉,但并非不可去除的。由此,它可用于附加有关媒体的原始出处、所有者和及其状态的信息。此信息随后可用于例如跟踪非法复制的源头。

将水印嵌入信号中的最常用技术基于源自扩频无线电通信的一种思想。这里,当将低振幅的伪随机噪声序列添加到原始信号中时,就创建了嵌入的水印。然后可以利用例如相关接收器或匹配滤波器在以后的阶段检测该添加的序列。如果适当地选择添加序列的参数(例如振幅或序列长度),则检测概率非常高。如果连续嵌入了多个此类水印,则可以携带若干比特的信息。一般而言,用于嵌入一个比特的样本数越多以及添加的序列的振幅越高,则水印越抗攻击。另一方面,振幅太高时,水印变得可闻,而样本数量增加时,嵌入的信息量减少。因此,稳健性、水印数据率和质量之间存在某种折衷。

基于扩频方法的水印技术需要非常严格的同步。如果维持不了这种同步,则不再可能检出嵌入的信息。因此,同步通常视为现有技术解决方案中的首要条件。

但正是此弱点被所谓的同步攻击所利用,这种攻击方法尝试破坏相关性并使水印恢复不可能或不可行。这种攻击可以是进行几何处理,例如进行缩放、旋转、剪切(shearing)、裁剪(cropping)和二次取样。对于音频,已知的处理有插入或删除单个音频样本等,类似例如抖动攻击、取样率转换如线性时间比例缩放、语音暂停的扩展或缩减或者音调移位。因为典型的水印检测器必须知道嵌入数据的确切位置,所以这些攻击非常有效,因此成为在音频信号中实际应用水印的一个主要问题。

因此,本发明的目的在于克服上述问题,并提供一种用于在数字音频信号中嵌入水印的方法,所述数字音频信号包括多个音调周期,并被分成多个N个样本组,该方法包括如下步骤:从所述多个N个样本组中选择具有一定输入长度的输入段,将所述输入段划分成至少两个子段,每个子段具有至少一个音调周期的长度,创建具有输出长度的修改段,其中至少一个子段经过时移处理,以使重叠区域中两个子段的相关值最大,并且所述重叠区域中的信号是所述重叠区域中这两个子段的加权平均。

此外,提供一种在接收到的数字音频信号中检测水印的方法,其中接收到的数字音频信号可包括至少一个修改段,所述修改段根据上述嵌入方法作过修改;所述方法包括为了所述至少一个修改段接收有关下列各项的先验信息:输入段、修改段、扩展段和所述修改段的起始点;生成第一模板信号,此模板信号是所述输入段之前和之后分别具有扩展段的输入段;生成第二模板信号,此模板信号是所述修改段之前和之后分别具有扩展段的修改段;通过将所述第一和第二模板信号与接收到的数字音频信号比较来创建第一和第二相关值,并在第二相关值高于第一相关值时假定含有水印。

利用此方法,嵌入水印抗同步攻击的能力更强,因为该水印是以与攻击相同的方式生成的。应用于扩展段前或后的任何类型的同步攻击都不会降低所提出的检测方法的性能。虽然任何已知的检测水印的方法都将得益于原始信号的先验信息,但由此先决条件,所建议的方法的直接优点是具有抗同步攻击的更高稳健性。

如果与所述至少一个子段的时移等于一个音调周期,则修改段和相邻信号段之间的过渡是平滑的,因此,嵌入水印的可闻度较低。

如果与所述至少一个子段的另一个时移等于多个音调周期,则使输入段的输入长度与修改段的输出长度之差更大。由此,后续在数字音频信号中检测嵌入的水印变得更为容易,因为输入段和修改段之间的差异更易区分。

如果输入段是从多个N个样本组(其中连续音调周期是类似的)之一选择的,则嵌入信息的可闻度较低。这样,重叠区域中的结果信号(即重叠子段的加权平均)仅稍微不同于所述重叠区域之前和之后的这些音调周期。这使修改段的可闻度降低。

从所述多个N个样本组之一的中部或根据预定义的秘密密钥来选择输入段,使修改段的起始点为已知,这简化了后续的检测方法。

如果对若干输入段(其中每个相应修改段的输出长度不同)重复本嵌入方法的原理,则可以取得更高的调制电平,并由此可以将更多的信息包括在修改后的数字音频信号中。这样,根据不同修改段的数量,必须为检测方法生成对应数量的不同模板信号。

如果扩展段的长度在10毫秒至40毫秒之间,则认为在该范围内音频信号是大致固定的。因此,模板信号是可区分的且检测方面始终是足够稳健的。

结合附图进一步理解从属权利要求和如下详细说明,显然本领域技术人员会清楚本发明的其它特征和优点,附图中:

图1显示根据第一实施例,具有第一和第二子段的输入段;

图2显示根据第一实施例的输出段;

图3显示根据第二实施例,具有第一和第二子段的输入段;

图4显示根据第二实施例的输出段;

图5显示根据另一个实施例的输入段和输出段;

图6显示用于在数字音频信号中检测水印的模板信号。

在时域中,将数字音频信号划分成多个N个样本组。这是本领域技术人员已知的,因此不作更详细的描述。对所述多个N个样本组的部分应用根据本发明的嵌入和检测方法。图1显示输入段sin(t),它是从数字音频信号的多个N个样本组之一中选择的。数字音频信号具有多个连续音调周期P1、P2、P3、…、Pi,每个音调周期表征输入段sin(t)的一部分,并具有类似的波形。

长度为Lin的输入段sin(t)划分成两个子段Ssub,1(t)和Ssub,2(t),其长度分别为Lsub,1和Lsub,2。每个子段Ssub,1(t)和Ssub,2(t)包括至少一个完整的音调周期Pi。在所示实施例中,子段Ssub,2(t)紧随在子段Ssub,1(t)之后。如图2所示,为了创建修改段Sout(t),使第二子段Ssub,2(t)向第一子段Ssub,1(t)作时移。时移dt按如下要求确定:在得到的重叠区域Lov中,两个子段Ssub,1(t)和Ssub,2(t)的相关值最大。随后,对于重叠区域Lov,计算信号Sov(t)。该计算基于所述重叠区域中两个子段Ssub,1(t)和Ssub,2(t)的加权平均。因此,实现了在来自这些子段的未修改部分的信号与来自上述重叠区域的信号Sov(t)之间的平滑过渡。计算两个重叠信号的加权平均信号的不同实施例是本领域技术人员所熟知的,因此这里不作进一步详细描述。在本实施例中,时移dt正好是一个音调周期Pi,因为只有这样才能在重叠区域内实现两个重叠子段Ssub,1(t)和Ssub,2(t)的最大相关。在此条件下,通过创建加权平均形式的信号Sov(t),则修改段及相应的嵌入水印在数字音频信号中的可闻度较低。

图3显示了数字音频信号的输入段Sin(t)的另一个可能实施例。其中,安排了两个子段Ssub,1(t)和Ssub,2(t),使得输入信号Sin(t)的一部分未包括在这两个子段Ssub,1(t)和Ssub,2(t)之一中。为了嵌入水印,必须在时间轴上重新排列这两个子段Ssub,1(t)和Ssub,2(t),以便创建如图4所示的重叠区域。如第一实施例和本实施例所示,时移dt导致修改段Sout(t)的输出长度Lout较之输入段Sin(t)的输入长度Lin缩减。因此,为了创建修改段Sout(t),使第二子段Ssub,2(t)向第一子段Ssub,1(t)时移。时移dt的值也按前述要求确定,即在重叠区域Lov中,两个子段Ssub,1(t)和Ssub,2(t)的相关值必须为最大。最后,信号Sov(t)是针对重叠区域Lov来计算的,它是所述重叠区域Lov中两个子段Ssub,1(t)和Ssub,2(t)的若干部分的加权平均。

图5显示根据本发明的另一个实施例。与前述实施例相反,相对于输入段Sin(t)的输入长度Lin,修改段Sout(t)的输出长度Lout被延长。因此,有必要以如下方式划分输入段Sin(t):两个子段Ssub,1(t)和Ssub,2(t)重叠不止一个音调周期Pi。于是可以满足时移dt之后剩余重叠区域Lov中的相关值达到最大的要求。对于修改段Sout(t),如针对前述实施例所述的那样创建重叠区域Lov中的结果信号Sov(t)。

现在参考图6,下面将更详细地描述在接收到的数字音频信号中检测水印的方法。本检测方法的一个要求是,源于原始数字音频信号的信息和嵌入方法都是已知的先验信息。该信息是:输入段Sin(t)、修改段Sout(t)和该修改段的起始点t0。此外,由数字音频信号定义扩展段ΔS+(t),ΔS-(t)。扩展段ΔS-(t)是数字音频信号中在输入段Sin(t)之前长度为ΔL-的部分。长度为ΔL+的扩展段ΔS+(t)是数字音频信号中在输入段Sin(t)之后的部分。基于输入段Sin(t)、修改段Sout(t)和扩展信号ΔS+(t),ΔS-(t),生成多个模板信号hm(t)=h1(t),h2(t),h3(t),…,hM(t)。这些模板信号还用于检测修改段Sout(t),并由此检测接收到的数字音频信号中的嵌入水印。因此,第一模板信号h1(t)根据输入段Sin(t)以及输入段Sin(t)之前的扩展段ΔS-(t)和之后的扩展段ΔS+(t)生成。第二模板信号h2(t)根据修改段Sout(t)以及修改段Sout(t)之前的扩展段ΔS-(t)和之后的扩展段ΔS+(t)生成。输入段Sin(t)和修改段Sout(t)之前的扩展段ΔS-(t)是相同的信号段,在嵌入水印之前直接从原始音频信号中取得。输入段Sin(t)和相应修改段Sout(t)之后的扩展段ΔS+(t)同样如此。然后,将接收到的数字音频信号与上述第一和第二模板信号h1(t)和h2(t)比较。基于接收音频信号与第一模板信号h1(t)的比较,创建第一相关值c1。通过接收音频信号与第二模板信号h2(t)的比较,以同样的方式创建第二相关值c2。于是,这两个相关值c1和c2可指示接收的数字音频信号中是否嵌入有修改段。更具体地说,如果第二相关值c2高于第一相关值c1,则假定接收的数字音频信号中含有修改段Sout(t),并因此含有随后。相反,如果第一相关值c1较大,则假定不合水印。此外,在图6中,显示了第三模板信号h3(t)。此模板信号可在音频信号中嵌入了具有较高调制电平的水印时使用。在本实施例中,第二模板信号h2(t)包括一个缩减段,而第三模板信号h3(t)包括一个扩展段。虽然以三个模板信号对前述实施例作了描述,但本领域技术人员会认识到,当本发明应用于若干m=1,2,3,…,M个输入段Sin,m(t)(其中各相应修改段Sout,m(t)的输出长度Lout,m是不同的)时,可以实现高得多的调制电平。于是,根据不同修改段Sout,m(t)的数量M,还需要对应数量的不同模板信号hm(t)和相关值cM来实现检测。利用它,可以在修改的数字音频信号中包括并检测更多的信息。如果采用例如M=4个不同的修改段,则可以在一个N个样本组中传送2个比特的信息(=1d(M))。在最简单的方式中,可以通过插入和删除多个音调来取得每个相应修改段Sout,m(t)的不同输出长度Lout,m

以上基于不同实施例描述的本发明的主要范围是,实现一种对同步攻击具有较高抵抗力的加水印方法。此外,所建议的方法还可用于不影响同步的添加噪声和其它信号处理技术,如滤波。至少可预期与扩频水印相同的稳健性。此外,压缩技术也应该不是问题。这可以增加稳健性,因为所有这些攻击通常不会改变嵌入了所建议的水印的数字音频信号中的音调数量。此外,预计插入或删除单个样本的简单抖动攻击不会构成问题。只要插入或删除的样本数量不是太多,则即使轻微的移位也会在两个波形之间形成很高的互相关。即使在那种情况下,仍可以利用不同长度的修改段来重复所建议的检测方法。对水印而言,通常最严重的攻击是音调移位攻击(pitch-Shifting attack),考虑这种攻击,显然在模板区域外施加的任何比例缩放和移位都不应影响检测性能。如果输入段设在t0且对范围(t0-ΔL-)<t<(t0+ΔL++Lout)内的任何样本不作任何修改,则不会影响检测性能。仅当通过攻击在模板区域内执行附加的音调移位时,相关检测器才可能误导,且可能无法正确检出水印。但是,如果可以使扩展段ΔS+(t),ΔS-(t)的长度ΔL-和ΔL+保持相当短,例如对应于40毫秒,则为了以很高概率去除水印,必须每80毫秒就施加音调移位攻击。因此,本发明方案可以设计成,只要以低于每隔((ΔL-)+(ΔL+))个样本的频度插入附加音调,即可每隔N个样本嵌入一个水印比特并提供稳健性。假定((ΔL-)+(ΔL+))<<N,就可以将方案设计为嵌入是不可察觉的,而尝试去除水印会导致可闻失真。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号