首页> 中国专利> 基于多路声学特征数据增强的声场景分类方法

基于多路声学特征数据增强的声场景分类方法

摘要

本发明提供基于多路声学特征数据增强的声场景分类方法,其提高了声场景分类用分类器的准确率,同时提高了模型的泛化能力,使其能够以稳定的分类准确率应用在更多的场景中。本发明技术方案中,基于Mixup数据增强方式实现数据增强用特征生成器,同时生成多种声学特征,基于MCNN模型构建了多支路的声场景分类模型,通过多路声学特征并行输入分类器进行分类操作,使得多种声学特征相互补充提高了分类器的分类精度。

著录项

  • 公开/公告号CN111833906A

    专利类型发明专利

  • 公开/公告日2020-10-27

    原文格式PDF

  • 申请/专利权人 江南大学;

    申请/专利号CN202010726152.5

  • 发明设计人 曹毅;费鸿博;刘晨;周辉;

    申请日2020-07-25

  • 分类号G10L25/51(20130101);G10L25/30(20130101);G10L25/03(20130101);

  • 代理机构32227 无锡盛阳专利商标事务所(普通合伙);

  • 代理人顾吉云;黄莹

  • 地址 214000 江苏省无锡市滨湖区蠡湖大道1800号

  • 入库时间 2023-06-19 08:41:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-30

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号