基于梅尔频谱分离和LSCNet的声学场景分类方法

费鸿博; 吴伟官; 李平; 曹毅

首页> 中文期刊>哈尔滨工业大学学报 >基于梅尔频谱分离和LSCNet的声学场景分类方法

基于梅尔频谱分离和LSCNet的声学场景分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有频谱分离方法进行声学场景分类研究时其分类准确率不高的问题,提出了一种基于梅尔频谱分离和长距离自校正卷积神经网络(long-distance self-calibration convolutional neural network,LSCNet)的声学场景分类方法.首先,介绍了频谱的谐波打击源分离原理,提出了一种梅尔频谱分离算法,将梅尔频谱分离出谐波分量、打击源分量和残差分量;然后,结合自校正神经网络和残差增强机制,提出了一种长距离自校正卷积神经网络;该模型采用频域自校正算法以及长距离增强机制来保留特征图原始信息,通过残差增强机制和通道注意力增强机制加强了深层特征与浅层特征间的关联度,且结合多尺度特征融合模块,以进一步提取模型训练中输出层的有效信息,从而提高模型的分类准确率;最后,基于Urbansound8K和ESC-50数据集开展了声学场景分类实验.实验结果表明:梅尔频谱的残差分量能够针对性地减少背景噪音的影响,从而具有更好的分类性能,且LSCNet实现了对特征图中频域信息的关注,其最佳分类准确率分别达到90.1％和88％,验证了该方法的有效性.

著录项

来源
《哈尔滨工业大学学报》|2022年第5期|124-130123|共8页
作者
费鸿博; 吴伟官; 李平; 曹毅;
展开▼
作者单位

江南大学机械工程学院江苏无锡214122;

江苏省食品先进制造装备技术重点实验室(江南大学) 江苏无锡214122;

江南大学机械工程学院江苏无锡214122;

江苏省食品先进制造装备技术重点实验室(江南大学) 江苏无锡214122;

江南大学机械工程学院江苏无锡214122;

江苏省食品先进制造装备技术重点实验室(江南大学) 江苏无锡214122;

江南大学机械工程学院江苏无锡214122;

江苏省食品先进制造装备技术重点实验室(江南大学) 江苏无锡214122;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.42;
关键词
声学场景分类; 梅尔频谱分离算法; 长距离自校正卷积神经网络; 频域自校正算法; 多尺度特征融合;
入库时间 2022-08-20 11:47:19

相似文献

中文文献
外文文献
专利

1. 基于CQT和梅尔频谱的带有人声的音乐风格转换方法 [J] . 叶洪良 ,朱皖宁 ,洪蕾 . 计算机科学 . 2021,第0z1期
2. 基于数据增广的声学场景分类 [J] . 李源 ,马成男 ,李关防 . 指挥控制与仿真 . 2021,第001期
3. 基于多分辨率时频特征融合的声学场景分类 [J] . 姚琨 ,杨吉斌 ,张雄伟 . 声学技术 . 2020,第4期
4. 基于多特征融合的SVM声学场景分类算法研究 [J] . 赵薇 ,靳聪 ,涂中文 . 北京理工大学学报 . 2020,第1期
5. 基于卷积神经网络的声学场景分类算法研究 [J] . 赵薇 ,黄敬雯 ,靳聪 . 中国传媒大学学报（自然科学版） . 2019,第002期
6. 基于多层次特征组合的彩色场景分类方法 [C] . Cui Yin ,崔崟 ,Duan Fei . 第十六届全国图象图形学学术会议暨第六届立体图象技术学术研讨会 . 2012
7. 基于子频谱的声学场景分类方法研究 [A] . 王运航 . 2021

基于梅尔频谱分离和LSCNet的声学场景分类方法

摘要

著录项

相似文献

相关主题

期刊订阅