首页> 中文学位 >复合音乐中歌声旋律的提取
【6h】

复合音乐中歌声旋律的提取

代理获取

目录

声明

摘要

缩写说明

第1章 绪论

1.1 研究背景与意义

1.2 课题研究现状与发展趋势

1.3 本文主要工作与内容安排

第2章 基础知识

2.1 基本概念

2.1.1 音的四要素

2.1.2 基音与泛音

2.1.3 旋律

2.1.4 随机森林

2.2 歌声旋律提取的流程

2.3 实验数据库介绍

2.4 评价准则

2.5 本章小结

第3章 歌声检测

3.1 梅尔频率倒谱系数及其改进

3.1.1 梅尔频率倒谱系数

3.1.2 对数频率倒谱系数

3.1.3 共振峰频率倒谱系数

3.1.4 基于颤音的八度频率倒谱系数

3.1.5 基于谐波的八度频率倒谱系数

3.1.6 音色倒谱系数

3.1.7 Gammatone倒谱系数

3.2 线性预测系数及其倒谱系数

3.2.1 线性预测系数

3.2.2 线性预测倒谱系数

3.3 感知线性预测系数

3.4 基于线性预测谱的梅尔倒谱系数

3.5 小波能量

3.5.1 小波变换

3.5.2 小波能量

3.6 对数频率功率系数及其改进

3.7 特征提取及实验结果分析

3.8 本章小结

第4章 多基频估计与歌声旋律确定

4.1 多基频估计算法

4.1.1 迭代谱减算法

4.1.2 改进的谐波乘积谱算法

4.1.3 结果分析及比较

4.2 基频轨迹的跟踪

4.3 歌声旋律的确定

4.3.1 基于频率调制的方法

4.3.2 基于谐波能量比的方法

4.3.3 基于特征组合的方法

4.3.4 结果分析及比较

4.4 本章小结

第5章 总结与展望

5.1 主要研究工作总结

5.2 工作展望

参考文献

致谢

展开▼

摘要

复合音乐中歌声旋律的提取是音频信息检索领域的重点和难点。歌声旋律的提取在歌声分离、歌手识别以及哼唱检索中应用广泛。歌声旋律提取的主要任务是提取复合音乐中歌声的基频轨迹。本文的研究可在一定程度上提高歌声旋律提取的准确度。
  本文利用频域和倒频域特征对复合音乐进行歌声检测。本文考察梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于线性预测谱的梅尔倒谱系数(LPc-derived Mel Cepstrum Coefficient, LPMCC)对歌声检测的效果。实验结果表明,LPMCC的检测结果优于MFCC。考察对数频率功率系数(LogFrequency Power Coefficient,LFPC)以及在此基础上提出了梅尔频率功率系数(Mel Frequency Power Coefficient,MFPC)和Gammatone频率功率系数(Garnmatone Frequency Power Coefficient,GFPC)的检测效果。实验结果表明,25维的LFPC的歌声检测准确率最好。
  本文采用迭代谱减算法和改进的谐波乘积谱算法(Modified Harmonic ProductSpectrum,MHPS)对复合音乐进行多基频估计,并比较这两种算法的性能。迭代谱减算法主要解决多基频估计中谐波重叠的问题,而MHPS算法在一定程度上解决了多基频估计中基频丢失和八度错误的问题。实验结果表明,迭代谱减算法每帧估计的基频个数明显小于MHPS算法,而且迭代谱减算法能得到更好的原始基频准确率。
  本文对得到的多基频集合根据时间连续性和频率连续性进行基频轨迹的跟踪,通过实验发现:经过基频轨迹跟踪之后,原始基频跟踪准确率略有提高,而且排除了较多的野点。本文提出了基于谐波能量比的方法确定歌声的旋律,并总结了两种已有的方法,分别是基于频率调制的方法和基于特征组合的方法。对比这三种方法的性能发现:基于特征组合的方法能够更好地确定基频轨迹中的歌声基频轨迹,提高了歌声基频提取的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号