首页> 中文学位 >基于深度注意力机制的音乐流派分类方法研究
【6h】

基于深度注意力机制的音乐流派分类方法研究

代理获取

目录

第一个书签之前

摘  要

Abstract

1 绪论

1.1 课题研究背景与意义

1.2 音乐流派分类的研究现状

1.2.1 传统的音乐流派分类

1.2.2 基于深度学习的音乐流派分类

1.3 本文主要研究内容及章节安排

1.3.1 本文主要内容

1.3.2 章节安排

2 相关理论及技术

2.1 引言

2.2 音乐特征

2.2.1 时域特征

2.2.2 频域特征

2.2.3 倒谱域特征

2.3 STFT声谱图

2.4 卷积神经网络

2.5 循环神经网络

2.6 注意力机制与编解码框架

3 基于深度串行注意力机制的分类模型

3.1 引言

3.2 基于深度串行注意力机制的分类模型实现

3.2.1 双向循环神经网络

3.2.2 Adam优化算法

3.3 音乐流派分类实验结果与分析

3.3.1 数据集介绍与数据集增强

3.3.2 实验设置

3.3.3 实验结果分析

3.4 本章小结

4 基于深度并行注意力机制的分类模型

4.1 引言

4.2 基于深度并行注意力机制的分类模型实现

4.2.1 并行线性注意力模型

4.2.2 并行CNN注意力模型

4.3 音乐流派分类实验结果与分析

4.3.1 实验设置

4.3.2 实验结果分析

4.4 本章小结

结  论

参考文献

攻读硕士学位期间发表学术论文情况

致  谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

随着互联网和多媒体设备的普及,数字音乐在各大应用平台的数量急剧增加。海量的音乐数据对用户造成了极大的混乱,并且很难通过人工对庞大的音乐数据库进行管理。所以如何利用计算机自动地对音乐进行分类和管理成为了目前急需解决的问题。音乐流派作为一种可以描述和理解音乐的标签,能有效区分不同风格的音乐。因此,音乐流派分类任务成为了音乐信息检索领域中最受关注的研究方向之一。 在音乐流派分类任务中,特征提取和分类器建模是直接影响分类准确率的两个关键部分。传统的分类方法将特征提取和分类过程进行分别设计,先手动地从原始音乐信号中提取特征,然后选择合理的分类器建模并对提取的特征进行分类。虽然传统的方法在很多分类任务中取得了很好的效果,但特征提取过程复杂不易实现,且不同的分类任务所需的特征需要专门设计,提取得到的特征缺乏通用性。随着深度学习模型在其他领域的成功应用和不断发展,越来越多的研究开始利用音乐的声谱图作为深度学习模型的输入进行音乐流派分类。但目前为止,已有的基于深度学习的分类方法的准确率还并不理想,所以本文主要研究一种基于深度学习的分类方法,以此来提高音乐流派分类模型的分类准确率。 本文共提出了两种结构的基于深度注意力机制的分类模型,一种是串行结构的深度注意力分类模型。通过对BRNN的训练,使得其可以自动地从样本中学习到音乐特征,线性的注意力模型根据学习到的特征计算出在该特征上的注意力概率分布,并重新分配给该特征表示。最后根据分配了不同权重的特征向量实现分类。但是,由于串行的注意力模型依赖于BRNN的训练结果,若BRNN不能得到有效的特征表示,则会影响注意力模型的学习效果。考虑到串行结构的局限性,本文对其进行了改进。提出了另一种并行结构的深度注意力分类模型。并且除了结构简单的线性注意力模型,还设计了一种学习能力更强的CNN注意力模型。为了验证模型的可行性和有效性,本文分别在GTZAN和Extended Ballroom两个标准数据集上做了验证实验。实验结果表明,相比于串行结构的分类模型,基于深度并行注意力机制的分类模型分类效果更好,并且利用BRNN与并行的CNN注意力模型进行分类,在Extended Ballroom数据集上准确率达到92.7%,优于现有的基于深度学习的分类方法,证明了该分类模型的有效性和可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号