首页> 中国专利> 一种基于长短时特征提取的音频场景识别方法及装置

一种基于长短时特征提取的音频场景识别方法及装置

页面导航

摘要
著录项
相似文献

摘要

本发明涉及一种基于长短时特征提取的音频场景识别方法及装置，该方法包括，对输入待识别音频信号进行预处理；对经过预处理后的所述待识别音频信号，进行短时音频特征提取，再进行长时音频特征提取，将所述待识别音频信号的所述长、短时音频特征联合，输入分类模型及其融合模型，进行分类和识别，输出音频场景的识别标签。本发明在常规短时特征提取的基础之上，进一步联合音频场景长时特征，可以表征复杂的音频场景信息，输入分类模型及其融合模型，进行分类和识别，输出音频场景的识别标签，其鲁棒性更强、区分性更好，且能够在更大程度上表征场景数据的整体特性，识别效率高、稳定性强。

著录项

公开/公告号CN108305616B

专利类型发明专利
公开/公告日2021-03-16

原文格式PDF
申请/专利权人国家计算机网络与信息安全管理中心;中国科学院声学研究所;
展开▼

申请/专利号CN201810039421.3
发明设计人袁庆升;白海钏;张鹏远;包秀国;刘洋;张翠;汪立东;杜翠兰;时磊;张鸿;云晓春;颜永红;崔佳;林绅文;王钲淇;
展开▼

申请日2018-01-16
分类号G10L15/02(20060101);G10L15/08(20060101);G10L15/14(20060101);G10L25/24(20130101);
代理机构11472 北京方安思达知识产权代理有限公司;
代理人陈琳琳;杨青
地址 100029 北京市朝阳区裕民路甲3号
入库时间 2022-08-23 11:35:36

相似文献

专利
中文文献
外文文献

1. 一种基于长短时特征提取的音频场景识别方法及装置 [P] . 中国专利： CN108305616B . 2021.03.16
2. 一种基于长短时特征提取的音频场景识别方法及装置 [P] . 中国专利： CN108305616A . 2018-07-20
3. METHOD AND DEVICE FOR FEATURE EXTRACTION AND METHOD FOR IMAGE BASED LOCATION RECOGNITION USING THE SAME BY USING HIERARCHICAL IMAGE SEGMENTATION [P] . 韩国专利： KR20110016160A . 2011-02-17

机译：基于分层图像分割的特征提取方法和装置以及基于图像的位置识别方法
4. NEURAL NETWORK-BASED MULTILAYER IMAGE FEATURE EXTRACTION MODELING METHOD AND DEVICE AND IMAGE RECOGNITION METHOD AND DEVICE [P] . 世界知识产权组织专利： WO2018068416A1 . 2018-04-19

机译：基于神经网络的多层图像特征提取建模方法及装置和图像识别方法及装置
5. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC-based spatial audio coding using low-, medium- and high-order component generators [P] . KR20210097775A . 2021-08-09

机译：用于编码，解码，场景处理和与基于DIRAC的空间音频编码相关的其他程序的装置，方法和计算机程序，使用低阶组件和高阶分量发生器与基于DIRAC的空间音频编码相关