首页> 中文学位 >基于哈希的音频指纹提取算法的研究
【6h】

基于哈希的音频指纹提取算法的研究

代理获取

目录

摘要

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 本文工作及论文结构

第二章 音频指纹提取中的哈希技术分析

2.1 哈希函数的定义

2.2 哈希函数的应用

2.2.1 密码学中的哈希函数

2.2.2 哈希函数在音频指纹中的应用

2.3 感知哈希

2.4 本章小结

第三章 音频指纹提取的几种办法

3.1 元数据信息提取

3.1.1 音频信号的数字化

3.1.2 音频特征信息提取

3.2 基础变换

3.2.1 傅里叶变换(Fourier)

3.2.2 短时傅里叶变换

3.3 基于内容的音频指纹提取

3.3.1 基于频率子带的音频指纹提取算法

3.3.2 基于时间色度图的音频指纹提取算法

第四章 基于梅尔频率倒谱的音频特征提取

4.1 预处理

4.2 梅尔频率倒谱系数

4.3 新的音频特征提取算法流程

4.4 算法分析

第五章 基于新算法的音频指纹双因子检索办法

5.1 音频指纹的匹配

5.2 双因子匹配算法

5.3 算法分析

5.3.1 鲁棒性分析

5.3.2 抗噪性分析

5.4 本章小结

第六章 总结

参考文献

致谢

声明

展开▼

摘要

近年来,随着多媒体技术的不断发展和互联网的普及,各式各样的多媒体应用也层出不穷,也越来越深入人们的日常生活。特别是音乐识别类应用,人们通常希望能识别出未知音频的详细信息,例如歌曲的名字,歌曲的演唱者、作曲人等。由于网络环境的包容性和复杂性,音频文件通常会经过压缩、编辑等操作,导致音频文件的失真或不完整,另外,在音频的传输过程中还可能产生噪音,如何在各种环境下鲁棒而又高效的识别大量的音频文件成了音频指纹技术中的一大难点。
  音频指纹技术通过提取音频信号的特征对音频进行识别。音频指纹是数字音频信号经过哈希函数压缩后的一种紧致表现,能唯一的标识音频信号。本文对哈希函数的发展以及在音频指纹领域的应用进行了总结,阐述了音频哈希函数从传统哈希函数到感知哈希函数的进化历程。感知哈希函数继承了传统哈希函数的优点,通过模拟入耳听觉特性,使得生成的指纹具有抗内容保持操作、对内容篡改操作的敏感性。梅尔域就是一种模拟入耳听觉系统的数据模型。
  本文提出了一种基于梅尔滤波器的哈希构造方法,指纹具有感知特性,并且加入了动态特征系数以及平均能量值,提高了指纹的识别性和鲁棒性。在指纹的后处理当中应用了哈尔小波变换,有效的减小了音频指纹的体积。
  针对新提出的指纹算法,本文还提出了一种新的双因子匹配算法,将音频指纹从方向和距离两个维度来比较相似度,提高匹配的效率及准确率。我们对提出的新算法进行了实验。实验表明,本文提出的算法提取出的指纹具有较高的精度、较小的体积,能有效的减小指纹数据库的空间,匹配过程中的双因子系数能提高指纹匹配率,适用于音频文件退化或者有一定噪音背景的场景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号