首页> 中文学位 >基于混合卷积神经网络模型的音频场景分类

【6h】

基于混合卷积神经网络模型的音频场景分类

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 基于特征提取的研究现状

1.2.2 基于深度学习的音频场景分类研究现状

1.2.3 目前研究存在的问题

1.3 本文研究内容

1.4 本文组织结构

2 音频场景分类理论基础

2.1 音频场景分类的基本原理

2.2 音频预处理

2.2.1 预加重

2.2.2 分帧

2.2.3 加窗

2.3 特征提取

2.3.1 梅尔声谱图

2.3.2 梅尔频率倒谱系数

2.4 实验准备

2.4.1 实验数据集

2.4.2 实验环境

2.4.3 评价指标

2.5 本章小结

3 基于CNN的音频场景分类

3.1 卷积神经网络理论基础

3.1.1 卷积层

3.1.2 池化层

3.1.3 全连接层

3.1.4 激活函数

3.1.5 正则化

3.2 基于两种音频特征提取的算法研究

3.2.1 基于梅尔声谱图提取

3.2.2 基于梅尔频率倒谱系数特征提取

3.2.3 实验结果与分析

3.3 基于CNN模型结构的改进

3.3.1 基于MFCC参数的改进

3.3.2 基于网络结构的改进

3.4 本章小结

4 基于混合卷积神经网络模型的音频场景分类

4.1 算法介绍

4.4.1 LSTM算法

4.4.2 极度梯度提升算法

4.2 基于CNN-LSTM的分类算法

4.2.1 LSTM基线模型

4.2.2 CNN-LSTM 混合模型

4.2.3 实验结果与分析

4.3 基于CNN-XGBoost 的分类算法

4.3.1 XGBoost基线模型

4.3.2 CNN-XGBoost混合模型

4.3.3 实验结果与分析

4.4 不同算法模型比较与分析

4.5 本章小结

5 总结与展望

5.1 总结

5.2 展望

参考文献

在学研究成果

致谢

展开▼

著录项

作者
张壮壮;
展开▼
作者单位

内蒙古科技大学;

展开▼
授予单位内蒙古科技大学;
学科信息与通信工程
授予学位硕士
导师姓名杨立东;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 TP3TN7;
关键词

相似文献

中文文献
外文文献
专利

1. 改进卷积神经网络模型在遥感图像场景分类中的应用 [J] . 刘子维 ,张旭晴 ,王明常 . 世界地质 . 2020,第004期
2. 改进卷积神经网络的音频场景分类研究 [J] . 杨立东 ,张壮壮 . 现代电子技术 . 2021,第003期
3. 基于残差混合注意力机制的脑部CT图像分类卷积神经网络模型 [J] . 乔思波 ,庞善臣 ,王敏 . 电子学报 . 2021,第005期
4. 基于遗传算法优化卷积长短记忆混合神经网络模型的光伏发电功率预测 [J] . 王晨阳 ,汪志勇 ,段倩倩 . 物理学报 . 2020,第010期
5. 基于长短时记忆单元和卷积神经网络混合神经网络模型的视频着色方法 [J] . 张政 ,何山 ,贺靖淇 . 计算机应用 . 2019,第009期
6. 基于联合对角化的卷积混合语音频域盲分离算法 [C] . 王凯旋 ,袁大钧 ,刘静微 . 中国通信学会通信建设工程技术委员会2010年年会 . 2010
7. 基于HOG的音频特征提取研究及其在音频场景分类下的应用 [A] . 刘泉泉 . 2019

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号