音频数据检索快速算法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

机器听觉包括三大研究领域：语音信号处理与识别、一般音频信号分析、基于内容的音频检索。其中，语音信号处理与识别是一个传统的研究热点，随着音频数据的海量增长以及语音识别技术的相对稳定和成熟，音频检索逐渐成为了信息检索领域内的一个新的研究热点。音频检索研究如何从大量音频信息中快速准确地检索满足要求的音频数据。与语音识别技术相比，音频检索处理的数据是更一般的波形声音信号（包括语音和音乐），其研究成果可广泛地应用于远程教学、卫生医疗、数字图书馆、环境监测、新闻和娱乐节目的索引与标记等领域。
　　本学位论文研究了利用图像配准方法的音频数据快速检索算法，简称FAR(Fast Audio Retrieval)。首先，采用音频处理中的短时分析技术将音频数据划分成一个个短时帧，并提取其MFCC特征参数；其次，将音频短时帧的特征参数MFCC转换为二值图像；最后，采用图像配准的方法对测试模板和参考模板的MFCC特征参数进行模板匹配，计算两个模板之间的匹配程度，并将该结果作为两个模板间的相似性测度输出。
　　实验表明，利用图像配准方法的音频数据快速检索算法与基于DTW算法的音频检索算法相比，在检索的召回率、准确率以及 F-指标等方面都有较大的改善，而且采用了图像配准的方法，算法的执行效率也优越于DTW方法。因此，本学位论文提出的FAR算法可用于基于内容和语义的音频检索技术中。

著录项

作者
金小峰;
展开▼
作者单位

延边大学;

展开▼
授予单位延边大学;
学科计算机应用技术
授予学位硕士
导师姓名崔荣一;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
音频信息检索; 特征提取; 图像配准; 语音信号;

相似文献

中文文献
外文文献
专利

1. 基于内容的音频数据检索研究 [J] . 刘文辉 ,蚩志锋 . 喀什师范学院学报 . 2009,第006期
2. 音频数据检索技术的研究 [J] . 李应 . 集美大学学报（自然科学版） . 2006,第002期
3. 单片机实现音频频谱显示的快速算法研究 [J] . 吴继发 ,陈特放 . 电子设计工程 . 2009,第011期
4. 音频数据检索专利技术综述 [J] . 邓慧丽 ,何华 . 科技创新与应用 . 2016,第025期
5. 一种高效过滤提纯音频大数据检索方法 [J] . 张兴忠 ,王运生 ,曾智 . 计算机研究与发展 . 2015,第009期
6. 网络音频数据检索技术 [C] . 张卫强 ,刘加 . 2007年全国网络与信息安全技术研讨会 . 2007
7. 基于音频词袋和MPEG-7特征的暴力视频快速分类算法研究 [A] . 李荣杰 . 2010

音频数据检索快速算法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅