声明
致谢
摘要
缩略词表
1.1.1 音乐标注基本概念
1.1.2 深度学习
1.2 国内外研究现状
1.2.1 传统的音乐标注方式
1.2.2 音频特征提取
1.2.3 深度学习在音乐领域的应用
1.2.4 深度学习在音乐标注领域的应用
1.3 本文重点研究内容
1.4 论文结构安排
2.1 音频信号特征表达
2.1.1 梅尔倒谱系数
2.1.2 频谱图
2.2 深度学习
2.2.1 卷积神经网络
2.2.2 优化方法
2.2.3 正则化
2.3 本章小结
3.模型结构设计和平台搭建
3.1 数据集
3.2 问题描述
3.3 模型设计思路
3.3.1 输入信号
3.3.2 卷积层窗口和轴
3.3.3 池化层的大小和轴
3.3.4 损失函数定义
3.4 模型结构
3.4.1 梅尔频谱系数模型
3.4.2 频谱图模型
3.4.3 原始音频模型
3.5:深度学习平台搭建
3.5.1 深度学习平台
3.5.2 软件安装
3.5.3 硬件
3.6 本章小结
4.实验结果和讨论
4.1 模型训练以及收敛的细节
4.1.1 不同训练速率对于训练收敛过程的影响
4.1.2 不同梯度下降方法对于训练速度的影响
4.2 模型表现的对比
4.2.1 不同模型的对比
4.2.2 与相关工作的对比
4.3 不同深度的模型在MSD上的表现
4.4 本章小结
5 卷积神经网络可视化
5.1 模型可视化的思路
5.2 卷积神经网络可视化的一般模型结构
5.3 可视化模型的损失函数定义
5.4 可视化模型的训练方式
5.5 梅尔频谱图模型的可视化效果
6 结论和展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集