首页> 中国专利> 一种基于谐波冲击源分离数据增强的音频场景识别方法

一种基于谐波冲击源分离数据增强的音频场景识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

一种基于谐波冲击源分离数据增强的音频场景识别方法，包括：对训练集中的音频进行总谐波分量H与总冲击分量P的分离，通过由一段音频生成两段音频，实现数据增强；将经过谐波冲击源分离得到的两段音频作为训练集输入场景识别系统，进行音频特征提取；将训练集的音频特征作为分类器网络的输入，训练分类器网络，在测试集中根据分类器网络的输出结果识别音频场景。本发明用于在音频场景识别，采用相同的分类器模型，分类准确率得到了较大的提升。通过基于谐波冲击源分离数据增强，系统将会获得一个更大、更多样化的训练集。基于该训练集对分类器网络进行训练，可以很好地提升分类器网络的学习能力和泛化能力。

著录项

公开/公告号CN110070856A

专利类型发明专利
公开/公告日2019-07-30

原文格式PDF
申请/专利权人天津大学;
展开▼

申请/专利号CN201910233185.3
发明设计人张涛;刘赣俊;
展开▼

申请日2019-03-26
分类号G10L15/02(20060101);G10L15/04(20130101);G10L15/06(20130101);G10L15/08(20060101);G10L15/26(20060101);G10L19/02(20130101);G10L25/27(20130101);G10L25/51(20130101);
代理机构12201 天津市北洋有限责任专利代理事务所;
代理人杜文茹
地址 300072 天津市南开区卫津路92号
入库时间 2024-02-19 11:59:52

法律信息

法律状态公告日

法律状态信息

法律状态
2019-08-23

实质审查的生效 IPC(主分类):G10L15/02 申请日:20190326

实质审查的生效
2019-07-30

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于谐波冲击源分离数据增强的音频场景识别方法 [P] . 中国专利： CN110070856A . 2019-07-30
2. 一种基于音频事件和主题模型的音频场景识别方法及其装置 [P] . 中国专利： CN106205609A . 2016-12-07
3. A method for separating composite data from simultaneous sources containing data responses to at least two sources, apparatus for acquiring and separating simultaneous source data by a diverse frequency filter, where composite simultaneous source data contains responses to at least two sources, and system data processing to separate simultaneous source composite data by diverse frequency filtering, where simultaneous source composite data contains responses to at least two sources [P] . BR112014012550A2 . 2017-06-13

机译：一种用于从包含对至少两个源的数据响应的同时源分离复合数据的方法，用于通过分集频率滤波器获取和分离同时源数据的装置，其中复合同时源数据包含对至少两个源的响应的设备以及系统数据处理通过不同的频率过滤分离并发源复合数据，其中，并发源复合数据包含对至少两个源的响应
4. Audio system for use in motor car, has processor device coupled with audio sources and audio compressor, which compresses audio signal based on audio source change from one source to another source based on audio compressor threshold value [P] . 德国专利： DE102010040689A1 . 2012-03-15

机译：用于机动车辆的音频系统具有与音频源和音频压缩器耦合的处理器设备，该音频压缩器基于音频源阈值基于音频压缩器阈值将音频信号从一个源更改为另一个源来压缩音频信号
5. Way of sound separation composite audio data, speaker identification method, voice separation apparatus of complex audio data, speaker specific equipment, computer program, and recording medium [P] . 日本专利： JP3364487B2 . 2003-01-08

机译：声音分离复合音频数据的方式，说话者识别方法，复杂音频数据的声音分离装置，说话者专用设备，计算机程序和记录介质