基于多分辨率时频特征融合的声学场景分类

姚琨; 杨吉斌; 张雄伟; 郑昌艳; 孙蒙

首页> 中文期刊> 《声学技术》 >基于多分辨率时频特征融合的声学场景分类

基于多分辨率时频特征融合的声学场景分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

声学场景分类是计算机听觉中最难的任务之一,在单一特征条件下采用基本的卷积神经网络相对于传统的分类方法精度已经有所提升,但是效果依然不够理想。针对这一问题,在卷积神经网络框架下,提出了一种基于时频特征融合的声学场景分类方案。在分类模型构建方面,提出一种多分辨率卷积池化方案,构造多分辨率卷积神经网络,以更好地适应提取特征的时频结构;在特征选取方面,融合低层次包络特征对数——Mel子带能量和高层次结构特征——非负矩阵分解系数矩阵,把两种二维特征堆叠为三维特征送入分类模型。在2017年和2018年声学场景分类和事件检测挑战赛的开发数据集上进行了训练和测试。实验结果表明,文中提出方案比基线系统的分类精度分别提高7.5%和10.3%,可有效改善分类效果。

著录项

来源
《声学技术》 |2020年第4期|494-500|共7页
作者
姚琨; 杨吉斌; 张雄伟; 郑昌艳; 孙蒙;
展开▼
作者单位

陆军工程大学;

江苏南京210007;

展开▼
原文格式 PDF
正文语种 chi
中图分类信号处理;
关键词
声学场景分类; 多分辨率卷积神经网络; 时频特征融合; 时频结构; 非负矩阵分解;

相似文献

中文文献
外文文献
专利

1. 基于多分辨率特征和时频注意力的环境声音分类 [J] . 刘慧 ,李小霞 ,何宏森 . 计算机应用研究 . 2021,第012期
2. 一种多尺度时频纹理特征融合的场景分类算法 [J] . 史静 ,朱虹 ,邢楠 . 仪器仪表学报 . 2016,第10期
3. 基于多特征融合的SVM声学场景分类算法研究 [J] . 赵薇 ,靳聪 ,涂中文 . 北京理工大学学报 . 2020,第1期
4. 时频图像特征用于声场景分类 [J] . 高敏 ,尹雪飞 ,陈克安 . 声学技术 . 2017,第5期
5. 基于多特征多分辨率融合的高光谱图像分类 [J] . 张钧萍 ,张晔 . 红外与毫米波学报 . 2004,第005期
6. 小波多分辨率分析信号时频特征的故障检测方法 [C] . . 第19届中国过程控制会议 . 2008
7. 心音信号的时频特征融合及分类技术研究 [A] . 唐世杰 . 2021

基于多分辨率时频特征融合的声学场景分类

摘要

著录项

相似文献

相关主题

期刊订阅