首页> 中文期刊>电子设计工程 >基于Squeeze-Excitation的音频场景分类研究

基于Squeeze-Excitation的音频场景分类研究

     

摘要

目前音频场景分类任务中主要使用对数梅尔谱图作为特征,大多数研究人员选择对每个通道的特征信息进行处理,鲜有研究考虑特征通道间信息的问题.文中将图像分类中有着较好效果的Squeeze-Excitation(SE)模块引入到音频场景分类任务中,以解决未考虑特征通道信息的问题.在基础的CNN网络结构中添加SE模块可以较好地考虑特征通道间的信息,进而提高网络的表达能力,同时还探究了SE模块添加的位置与数量对音频场景分类效果的影响.实验结果证明,添加SE模块能够提高场景分类的准确率,相比于基线系统分类准确率提高了1.1%;只有当SE模块添加在特征通道数比较多的卷积块之后才能够达到比较好的效果,而增加SE模块的数量相较于基线系统分类准确率提高不明显,为0.3%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号