首页> 中国专利> 一种音频帧序列到事件标签序列的声音事件标注方法

一种音频帧序列到事件标签序列的声音事件标注方法

页面导航

摘要
著录项
相似文献

摘要

本发明涉及一种音频帧序列到事件标签序列的声音事件标注方法，包括如下步骤：步骤S1:从给定音频文件中提取梅尔能量特征，并将其处理成特征序列；步骤S2:根据得到的特征序列，使用三层卷积神经网络提取每帧的抽象特征，并通过双向门限递归单元神经网络提取帧综合特征序列；步骤S3:根据得到的综合特征序列，通过Softmax前馈神经网络层作为注意力机制层，得到注意力特征,并进一步得到事件标签序列；步骤S4:将得到的所有音频片段的声音事件标签序列联合，并进行合并和平滑处理,得到检测结果。本发明使用多任务损失机制，在降低误检测的同时提高事件检出率，改善定位准确度，最后对模型输出进行平滑和合并处理，以显著提高音频文件中声音事件的标注精度。

著录项

公开/公告号CN110827804B

专利类型发明专利
公开/公告日2022-06-14

原文格式PDF
申请/专利权人福州大学;
展开▼

申请/专利号CN201911111989.2
发明设计人余春艳;刘煌;乔锦浩;
展开▼

申请日2019-11-14
分类号G10L15/06;G10L15/16;G10L25/24;G10L25/30;
代理机构福州元创专利商标代理有限公司;
代理人陈明鑫;蔡学俊
地址 350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学
入库时间 2022-08-23 13:50:58

相似文献

专利
中文文献
外文文献

1. 一种音频帧序列到事件标签序列的声音事件标注方法 [P] . 中国专利： CN110827804A . 2020-02-21
2. 一种基于序列到序列的警情笔录事件抽取方法 [P] . 中国专利： CN111507107A . 2020-08-07