首页> 中国专利> 一种基于卷积神经网络和随机森林的音频分类方法

一种基于卷积神经网络和随机森林的音频分类方法

摘要

本发明公开了一种基于卷积神经网络和随机森林的音频分类方法,该方法包括:S1:对原始音频数据集进行频谱分析,包括分段、分帧、加窗、傅里叶变换,得到原始音频文件对应的频谱图;S2:以得到的频谱图作为输入,训练一个卷积神经网络特征提取器;S3:去掉卷积神经网络的softmax层,提取频谱图的高层特征;S4:利用提取的频谱图高层特征训练随机森林分类器;S5:基于卷积神经网络提取的高层特征,利用训练好的随机森林进行音频分类。本发明基于卷积神经网络做特征提取,避免了手动构造提取特征的繁琐过程,同时针对采用softmax作为卷积神经网络分类器导致泛化能力不足的问题,采用随机森林替换掉卷积神经网络的softmax层,作为最终的分类器。在测试过程中取得了较高的准确率和召回率。

著录项

  • 公开/公告号CN108122562A

    专利类型发明专利

  • 公开/公告日2018-06-05

    原文格式PDF

  • 申请/专利权人 四川大学;

    申请/专利号CN201810037337.8

  • 发明设计人 彭德中;付炜;

    申请日2018-01-16

  • 分类号G10L25/54(20130101);G10L25/45(20130101);G10L25/30(20130101);G10L25/27(20130101);G10L25/18(20130101);G06N3/04(20060101);G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 610065 四川省成都市武侯区一环路南一段24号四川大学

  • 入库时间 2023-06-19 05:36:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-29

    实质审查的生效 IPC(主分类):G10L25/54 申请日:20180116

    实质审查的生效

  • 2018-06-05

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号