1 绪 论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 论文研究内容
1.4 论文组织安排
2 基于多尺度特征融合的声音场景分类
2.1 引言
2.2 卷积神经网络介绍
2.3 多尺度特征融合方法
2.3.1 Xception网络结构
2.3.2 多尺度特征融合
2.3.3 损失函数设计
2.4 实验与分析
2.4.1 数据集介绍及数据预处理
2.4.2 损失函数的参数选择
2.4.3 验证多尺度特征融合方法的性能
2.5 本章小结
3 声音场景分类的多尺度特征融合和通道加权方法
3.1 引言
3.2 多尺度特征融合和通道加权方法
3.2.1 多尺度特征融合
3.2.2 通道加权
3.2.3 网络的整体结构
3.3 实验与分析
3.3.1 加权网络中的参数选择
3.3.2 通道数对模型性能的影响
3.3.3 验证通道加权方法的性能
3.4 本章小结
4 标签平滑空间Mixup数据增广方法
4.1 引言
4.2 标签平滑Mixup数据增广方法
4.2.1 Mixup数据增广方法的原理
4.2.2 标签平滑正则化
4.2.3 标签平滑空间Mixup数据增广
4.3 实验与分析
4.3.1 模拟数据上的实验结果及分析
4.3.2 Mixup方法对模型性能的影响
4.3.3 标签平滑超参数选择
4.3.4 标签平滑对模型性能的影响
4.3.5 和最新的方法进行比较
4.4 本章小结
5 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
附录
A 作者在攻读硕士学位期间发表或投稿的论文
B 作者在攻读硕士学位期间参加的科研项目
C 学位论文数据集
致谢
重庆大学;