首页> 中国专利> 一种音频帧序列到事件标签序列的声音事件标注方法

一种音频帧序列到事件标签序列的声音事件标注方法

摘要

本发明涉及一种音频帧序列到事件标签序列的声音事件标注方法,包括如下步骤:步骤S1:从给定音频文件中提取梅尔能量特征,并将其处理成特征序列;步骤S2:根据得到的特征序列,使用三层卷积神经网络提取每帧的抽象特征,并通过双向门限递归单元神经网络提取帧综合特征序列;步骤S3:根据得到的综合特征序列,通过Softmax前馈神经网络层作为注意力机制层,得到注意力特征,并进一步得到事件标签序列;步骤S4:将得到的所有音频片段的声音事件标签序列联合,并进行合并和平滑处理,得到检测结果。本发明使用多任务损失机制,在降低误检测的同时提高事件检出率,改善定位准确度,最后对模型输出进行平滑和合并处理,以显著提高音频文件中声音事件的标注精度。

著录项

  • 公开/公告号CN110827804B

    专利类型发明专利

  • 公开/公告日2022-06-14

    原文格式PDF

  • 申请/专利权人 福州大学;

    申请/专利号CN201911111989.2

  • 发明设计人 余春艳;刘煌;乔锦浩;

    申请日2019-11-14

  • 分类号G10L15/06;G10L15/16;G10L25/24;G10L25/30;

  • 代理机构福州元创专利商标代理有限公司;

  • 代理人陈明鑫;蔡学俊

  • 地址 350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学

  • 入库时间 2022-08-23 13:50:58

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号