首页> 中文学位 >音频水印与语音变调取证
【6h】

音频水印与语音变调取证

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 鲁棒音频水印

1.1.1 音频水印简介

1.1.2 非压缩域音频水印

1.1.3 压缩域音频水印

1.2 语音变调取证

1.2.1 语音取证的产生、主要工作、发展和现状

1.2.2 说话人识别

1.2.3 变调后的FASR

1.3 本文的主要工作和创新点

1.3.1 非压缩域音频水印

1.3.2 压缩域(AVS)音频水印

1.3.3 说话人变调识别取证

1.4 本文的章节安排

第二章 基于二进小波变换抵抗同步攻击的鲁棒音频水印算法

2.1 引言

2.1.1 同步攻击和音频水印

2.1.2 相关的研究状况

2.2 二进小波变换的几何不变性

2.2.1 DCT、DFT和DWT的几何不变性

2.2.2 DYWT 的几何不变性

2.2.3 对DYWT几何不变性的讨论

2.3 水印嵌入和检测

2.3.1 水印嵌入

2.3.2 水印检测

2.3.3 实现中具体的问题

2.4 ECC和水印序列的比特重同步

2.4.1 IDS信道

2.4.2 本文算法的ECC策略

2.5 实验结果

2.5.1 嵌入量与失真

2.5.2 抗时域线性TSM和抖动的鲁棒性

2.5.3 对抗音调不变 TSM和PSM的鲁棒性

2.5.4 对抗Stirmark攻击

2.5.5 对抗普通攻击

2.5.6 对抗裁剪的鲁棒性

2.5.7 讨论及与已有算法的对比

2.6 小结

第三章 基于二进小波变换抵抗同步攻击的鲁棒音频水印算法

3.1 引言

3.2 对DYWT 几何不变性的进一步讨论

3.3 水印的嵌入和检测

3.4 ECC策略

3.5 实验结果

3.5.1 嵌入失真

3.5.2 鲁棒性测试

3.5.3 与已有算法的对比

3.5.4 讨论

3.6 小结

第四章 AVS音频鲁棒水印

4.1 引言

4.2 AVS音频编解码

4.2.1 AVS音频编解码的基本过程

4.2.2 基于心理声学模型的帧类型决策

4.3 水印算法

4.3.1 鲁棒特性

4.3.2 嵌入算法

4.3.3 算法实现中的具体问题

4.4 实验结果

4.4.1 失真

4.4.2 鲁棒性

4.5 小结

第五章 语音变调取证

5.1 引言

5.2 PSM变调

5.3 FASR的基本技术

5.3.1 基频的提取

5.3.2 MFCC的提取

5.3.3 特征匹配:DTW

5.4 语音库

5.5 变调后的语音取证方案

5.5.1 取证场景和方案

5.5.2 音调伸缩系数估计

5.5.3 改进型MFCC提取算法

5.6 实验结果

5.6.1 实验设置

5.6.2 训练阶段

5.6.3 测试阶段

5.6.4 交叉验证

5.6.5 阈值的选取

5.6.6 讨论

5.7 小结

第六章 总结和展望

附录

附录 A:WAV音频文件格式

附录 B:AVS音频流格式

附录 C: 线性插值算法(Matlab)

插图索引

表格索引

主要英文缩写对照表

参考文献

致谢

攻读博士学位期间的成果

展开▼

摘要

随着音频技术的广泛应用,保护音频作品成为信息安全领域的一个研究热点。音频水印是保护音频作品的有效方法之一,有着广阔的应用前景。尽管音频水印在近十年获得了长足的发展,但仍存在许多尚待解决的问题。音频的安全性是多方面的,除了音频水印,语音取证也是其中一个重要的研究领域。在司法领域里面,语音取证具有重要的应用价值。
   目前很多非压缩域音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击。
   本论文针对这个问题,对音频水印的鲁棒性进行了深入的研究,提出了基于二进小波变换几何不变性和特殊纠错编码的鲁棒音频水印算法。所提出的算法对各类同步攻击和幅度攻击都具有良好的鲁棒性。在压缩域音频水印方面,目前已有的算法主要是基于MPEG音频。信息技术先进音视频编码(简称AVS)中的音频标准是我国提出的音频压缩标准,但目前尚未有基于此种标准的音频算法。为此,我们设计了一种鲁棒的AVS音频算法。在语音取证方面,变调后说话人识别取证的问题尚未得到学界的足够注意。我们利用语音的基频、美频率倒谱系数等特性以及动态时间规整等方法,设计了一种变调后的说话人识别取证方法。
   论文的主要工作如下:
   工作(1):通过推导和实验比较了几种主流变换域与二进小波变换在几何不变性方面的性能,证明了二进小波变换具有更加优良的几何不变性,更适合作为水印的嵌入域。我们利用二进小波变换的峰值能量转折的几何不变性,提出了一种对时域线性伸缩、音调不变时域伸缩、音调伸缩、抖动等同步攻击和幅度攻击都鲁棒的音频算法。同时,我们设计了一种基于重复编码的纠错编码方案,对插入、删除和替换错误具有较强的纠错能力。所提出的水印算法在鲁棒性、不可察觉性和嵌入量等方面,都具有较好的性能。特别在鲁棒性方面,能较为全面地抵抗各类同步攻击和普通攻击,在一定程度上解决了众多已有音频水印算法无法抵抗同步攻击或者只能抵抗某类同步攻击的问题。但所提算法在提取水印时需要边信息,且所提的纠错编码方案对裁剪攻击较为脆弱。
   工作(2):针对工作(1)中尚存的问题,即提取水印需要边信息及纠错编码方案对裁剪攻击较脆弱的问题,通过对二进小波变换几何不变性更深入的探讨,我们提出了一种对同步攻击和幅度攻击都鲁棒的音频算法。该算法利用二进小波变换低频子带波峰的宽度作为水印定位的标准,利用波峰的高度作为提取水印时0-1判决的依据,较好地利用了二进小波变换的几何不变性。利用调制方式将水印能量扩散到一段系数中,提高了鲁棒性。同时设计了一种对插入、删除和替换错误具有极强纠错能力的纠错编码方案并实现了简单实用的译码方法。与工作(1)中的纠错编码相比,本工作中所提的纠错编码方案能够有效地抵抗裁剪攻击。实验证明,本算法能全面地抵抗各类同步攻击和普通攻击。与1)相比,本算法为完全的盲检测算法;其纠错编码方案能有效纠正插入、删除和替换错误外,还能成功地阻止误码扩散。
   工作(3):提出了一种AVS音频鲁棒水印的算法。该算法是一种压缩域鲁棒水印算法。我们将水印的嵌入算法整合到AVS音频压缩算法中,利用AVS压缩过程中使用的帧类型控制环节使得水印被编码到压缩流里面。提取端可直接从压缩比特流中提取水印。嵌入是通过修改某些小片段的样本点达到的,而提取则无须对压缩流解码,因此嵌入与提取过程的复杂度非常低,适用于对实时要求较高的场合。实验证明所提算法对解压/重压缩(AVS重压缩和MP3重压缩)都非常鲁棒。目前已有的压缩域水印算法都是基于MPEG音频,我们所提的本算法弥补了AVS音频水印的空白。
   工作(4):提出了一种变调后的说话人识别取证方法。本项工作基于音调伸缩变调原理和说话人识别的基本技术,提出了一种综合利用语音的基频、美频率倒谱系数和时间动态规整等特性和技术的变调识别取证方案。所提方案利用语音的基频特性估计变调系数,并对美频率倒谱系数提取算法进行了改进,即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中,使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法,计算语音之间的相似度。实验结果表明,在语音经过较大的变调后,常规的识别取证方案会造成较高或极高的漏检率和虚警率,对于取证完全失效;而我们所提的在识别性能上相比常规识别取证方法有极大的提高,在一定程度上能作取证之用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号