Environmental sound classification with convolutional neural networks

机译：卷积神经网络环境声音分类

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper evaluates the potential of convolutional neural networks in classifying short audio clips of environmental sounds. A deep model consisting of 2 convolutional layers with max-pooling and 2 fully connected layers is trained on a low level representation of audio data (segmented spectrograms) with deltas. The accuracy of the network is evaluated on 3 public datasets of environmental and urban recordings. The model outperforms baseline implementations relying on mel-frequency cepstral coefficients and achieves results comparable to other state-of-the-art approaches.

机译：本文评估了卷积神经网络在分类环境声音的短音频剪辑中的潜力。由具有最大池和2个完全连接的层组成的2个卷积层组成的深层模型，接受了具有增量的音频数据（分段谱图）的低级表示。在3个环境和城市记录的3个公共数据集中评估网络的准确性。该模型优于依赖于熔融频率谱系数的基线实现，实现与其他最先进的方法相当的结果。

著录项

来源
《IEEE International Workshop on Machine Learning for Signal Processing》|2015年||共6页
会议地点
作者
Piczak Karol J.;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类信号处理;
关键词
audio signal processing; cepstral analysis; neural nets; signal classification; audio clip; audio data; baseline implementation; convolutional layer; convolutional neural network; environmental recording; environmental sound classification; low level representation; max-pooling; mel-frequency cepstral coefficient; public dataset; segmented spectrogram; urban recording; Accuracy; Convolution; Convolutional codes; Neural networks; Pattern recognition; Training; Yttrium; classification; convolutional neural networks; environmental sound;

机译：音频信号处理;临时分析;信号分类;音频数据;音频数据;基线实施;卷积层;卷积神经网络;环境记录;环境声音分类;低水平表示;最大池谱;公共数据集;分段频谱图;城市录音;准确性;卷积;卷积码;神经网络;模式识别;培训;钇;钇;卷积神经网络;环境声;

相似文献

外文文献
中文文献
专利

1. Deep Convolutional Neural Networks and Data Augmentation for Environmental Sound Classification [J] . Justin Salamon, Juan Pablo Bello IEEE signal processing letters . 2017,第3期

机译：深度卷积神经网络和环境增强分类的数据增强
2. Attention based convolutional recurrent neural network for environmental sound classification [J] . Zhang Zhichao, Xu Shugong, Zhang Shunqing, Neurocomputing . 2021,第Sepa17期

机译：基于注意的卷积复发性神经网络，用于环境声分类
3. Environmental sound classification using a regularized deep convolutional neural network with data augmentation [J] . Mushtaq Zohaib, Su Shun-Feng Applied Acoustics . 2020,第Octa期

机译：使用具有数据增强的正则化深卷积神经网络的环境声音分类
4. Multi-channel Convolutional Neural Networks with Multi-level Feature Fusion for Environmental Sound Classification [C] . Dading Chong, Yuexian Zou, Wenwu Wang International conference on multimedia modeling . 2019

机译：具有多级特征融合的多通道卷积神经网络用于环境声分类
5. Combining Convolutional Neural Networks and Graph Neural Networks for Image Classification [D] . Trivedy, Vivek. 2021

机译：结合卷积神经网络和图形神经网络的图像分类
6. 3D Convolutional Neural Networks Initialized from Pretrained 2D Convolutional Neural Networks for Classification of Industrial Parts [O] . Ibon Merino, Jon Azpiazu, Anthony Remazeilles, 2021

机译：3D卷积神经网络从佩带的2D卷积神经网络初始化用于工业部件的分类
7. Rethinking environmental sound classification using convolutional neural networks: optimized parameter tuning of single feature extraction [O] . Yousef Abd Al-Hattab, Hasan Firdaus Zaki, Amir Akramin Shafie 2021

机译：使用卷积神经网络重新思考环境声音分类：单个特征提取的优化参数调整

Environmental sound classification with convolutional neural networks

摘要

著录项

相似文献

相关主题

期刊订阅