首页> 中文学位 >基于和谐泛音检测的主旋律提取技术
【6h】

基于和谐泛音检测的主旋律提取技术

代理获取

摘要

随着音乐媒体信息的持续增长,在海量音乐数据库中检索变得越来越困难,这种趋势对音乐信息检索提出了更高的要求。现有的网上音乐检索局限于分类浏览和基于文字的查找功能。基于内容的音乐检索(CMR: Content-based Music Retrieval)这一技术,尤其是哼唱检索(QBH: Query By Humming),作为一种传统文字检索所无法替代的检索手段,也越来越受到学者、开发商和广大用户们的注意。哼唱检索是属基于内容的音乐检索的一种方式,该方式允许用户通过哼唱的形式来检索所需的歌曲。为了找到一首歌曲,用户即使记不住曲名或者歌手名也不要紧,他还可以通过哼唱片断旋律找到所要的歌曲。这种新型的人机接口,对于在互联网上实现基于内容的音乐检索有着巨大的现实意义。 经过本实验室的多年努力,我们已经构建起了一套行之有效的哼唱检索系统。该系统能够接受多种方式的哼唱输入,检索速度快,搜索准确率高。但是也存在一定的局限性,比如乐曲库只能接受单音轨MIDI格式的音乐文件,对于那些多音轨MIDI、多音混合MP3等压缩文件格式以及wav等非压缩文件格式的音频数据,读取其主旋律仍是一个待开发的领域,需要进一步研究。本文针对多音轨混合音wav格式的音频文件,提出了一种基于和谐泛音检测的主旋律提取算法。该算法应用了泛音的概念,在音频信号的频谱中检测泛音显著度,通过分析泛音显著度指标计算得到多音音频的主基频。通过对多音轨MIDI格式文件转成的wav格式文件的模拟实验,该算法展现了极高的性能,与传统算法相比较,正确率有了极大的提高。该算法能在有多个辅音干扰的情况下提取出主音基频,因而具有了较强的抗噪声能力,这是传统算法望尘莫及的。此外,通过结合能量突出度检测和音高曲线的两阶段音符切分方法,我们使用该算法在原有系统上添加了将wav格式音频文件转换为单音轨MIDI格式主旋律文件模版以供哼唱检索系统的乐曲库使用的功能。这样就弥补了原有系统只能对拥有相应MIDI格式文件的音乐文件进行检索的缺陷,为系统乐曲库的多样性提供了很大的帮助。 本研究受到国家自然科学基金项目和上海市科委科技攻关项目的支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号