基于音频指纹的分片音频检索算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的快速发展，多媒体信息尤其是音频信息呈现出爆炸式增长。传统的基于文本的检索方法已经不能满足人们对音频信息检索的需求。基于音频信号的音频检索技术的研究正在快步推进，尤其是音频指纹检索技术是研究的热点，音频指纹是从音频信号中提取的一段数字摘要，比较的是其相应较小的数字指纹，而不是直接比较很大的音频数据本身。因此，音频指纹检索技术不仅能大大减少搜索量，而且能够显著的提高检索效率。随着技术发展，其应用场景已经进入音乐检索、版权保护、广告监播、电视互动等各种领域。因此，对音频指纹检索技术进行研究有很大的意义。
　　本文以Shazam算法为基础，通过对音频指纹提取过程进行分析，提出了改进的音频指纹提取算法，提高了音频检索的准确率。在改进音频指纹提取算法的基础上，提出了分片音频检索算法，在保证了检索准确率的同时，大大缩短了检索时间。主要工作如下：
　　提出了一种基于三角组合的音频指纹提取算法。详细分析Shazam算法中音频指纹提取过程的优缺点，针对Shazam算法中将频谱峰值点进行点对组合构成音频指纹，优化为一个锚点对应两个目标峰值点组成三角组合，以此构成音频指纹。这样不但可以增加指纹信息量，减少提取的指纹量，而且更加增强了音频指纹的鲁棒性，从而提高了音频检索算法的准确性和鲁棒性，并且通过仿真实验证明了该改进算法较高的检索性能。
　　提出了一种基于音频指纹的分片音频检索方法。该方法以改进的音频指纹提取算法为基础，对音频指纹提取和匹配过程进行优化，利用音频分片和匹配阈值的思想，将较长待检音频片段进行分片，对分片进行音频指纹提取和匹配，若匹配值大于匹配阈值，检索结束，就不用对剩余的分片进行任何处理，否则，就需要使用其他分片。该改进方法，在保证比较高的准确率的同时，能在很大程度上缩短检索时间，最后通过仿真实验也证明了该结论。

著录项

作者
张永;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科软件工程
授予学位硕士
导师姓名胡峰松,胡斌晖;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;检索机;
关键词
音频指纹; 分片音频检索; Shazam算法; 频谱峰值点; 阈值匹配;

相似文献

中文文献
外文文献
专利

1. 基于压缩感知和音频指纹的固定音频检索方法 [J] . 赵文兵 ,贾懋珅 ,王琪 . 计算机系统应用 . 2020,第008期
2. 基于音频指纹的两步固定音频检索 [J] . 乔立能 ,夏秀渝 ,叶于林 . 计算机系统应用 . 2017,第005期
3. 基于熵的音频指纹检索技术研究与实现 [J] . 王伟 ,陈志高 ,孟宪凯 . 计算机科学 . 2017,第0z1期
4. 一种音频指纹检索算法的改进方法 [J] . 胡俊 ,李胥 ,陈毅 . 工业控制计算机 . 2018,第002期
5. 一种改进的Philips音频指纹检索算法 [J] . 孙宁 ,赵维平 ,陈美 . 计算机工程 . 2018,第001期
6. 基于音频模板的音频检索与分类 [C] . 李恒峰 ,李国辉 . 第八届全国多媒体技术学术会议 . 1999
7. 基于音频LCM特征的音频水印和指纹算法 [A] . 麦少练 . 2010

基于音频指纹的分片音频检索算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅