首页> 中国专利> 一种用于音频场景分类的数据扩充方法及装置

一种用于音频场景分类的数据扩充方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本公开提出了一种用于音频场景分类的数据扩充方法及装置，该数据扩充方法首先基于LDA挖掘音频文档中的关键音频事件；其次，对每类音频场景，分别统计类内关键音频事件出现次数的概率分布、在每一出现次数下关键音频事件出现位置的概率分布以及在每一出现次数下，关键音频事件持续时长的概率分布；最后，根据统计得到的概率分布生成新音频文档。本公开提出的数据扩充方法由关键音频事件和非关键音频事件根据训练集中关键音频事件的概率分布生成新数据，这种方法生成的新数据能很好地模拟真实环境下的音频场景，因而能有效地提高模型的分类性能，在不同的网络结构下和不同的数据集上都具有良好的稳定性。

著录项

公开/公告号CN110853672A

专利类型发明专利
公开/公告日2020-02-28

原文格式PDF
申请/专利权人山东师范大学;
展开▼

申请/专利号CN201911088131.9
发明设计人冷严;赵玮玮;林婵;齐广慧;王荣燕;李登旺;华庆;
展开▼

申请日2019-11-08
分类号
代理机构济南圣达知识产权代理有限公司;
代理人闫圣娟
地址 250014 山东省济南市历下区文化东路88号
入库时间 2023-12-17 07:08:50

法律信息

法律状态公告日

法律状态信息

法律状态
2020-03-24

实质审查的生效 IPC(主分类):G10L25/18 申请日:20191108

实质审查的生效
2020-02-28

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种用于音频场景分类的数据扩充方法及装置 [P] . 中国专利： CN110853672A . 2020-02-28
2. 应用于音频监控的音频场景分类方法、装置以及设备 [P] . 中国专利： CN112562727A . 2021-03-26
3. Method and apparatus for synthesizing a binaural audio signal; method;.Method for synthesizing a stereo audio signal; parametric audio decoder; product of computer program stored on a computer mu00ecdia legu00ecvel and executable in a data processing device for processing an audio signal parametricamente codific ADO which comprises, at least,A combined signal of a plurality of audio channels and one or more sets of corresponding information that describe a sound image of multiple channel; the method to generate an encoded audio signal parametricamente; audio encoder for generating a parametric audio signal. Etricamente encoded; the product of computer program.Stored in a mu00ecdia legu00ecvel by computer and executable in a data processing device to generate an encoded audio signal parametricamente [P] . BRPI0706306A2 . 2011-03-22

机译：用于合成双耳音频信号的方法和装置;一种合成立体声音频信号的方法;参数音频解码器;计算机程序上存储的计算机程序产品，可在数据处理设备中执行以执行用于处理音频信号参数编码ADO的数据处理设备，该信号至少包括多个音频通道的组合信号和一组或多组音频描述多声道声像的相应信息;产生编码音频信号参数的方法;音频编码器，用于生成参数音频信号。 Etricamente编码;计算机程序的产品。通过计算机存储在计算机中，并在数据处理设备中可执行以生成编码的音频信号参数
4. Apparatus and method for construction of the storage, for the recovery and for the utilization of data, and, in particular, on memory - supported a method for carrying out of a virtually - simultaneous reproduction of audio effect data in synchronism with the reproduction of video data associated therewith in a system for audio - visual effects [P] . 德国专利： DE19882539T1 . 2000-07-06

机译：用于存储装置的构造，用于数据的恢复和利用并且尤其是在存储器上的装置和方法，支持一种用于与音频的再现同步地虚拟地同时再现音频效果数据的方法视听效果系统中与之关联的数据
5. METHOD AND APPARATUS FOR INTERLEAVING SINGAL BITS IN A DIGITAL AUDIO BROADCASTING SYSTEM A METHOD AND APPARATUS FOR INTERLEAVING BITS OF A DOGITAL SINGNAL REPRESENTATIVE OF DATA AND?OR AUDIO IN A DIGITAK AUDIO BROADCASTING SYSTEM [P] . IN223888B . 2008-09-26

机译：用于在数字音频广播系统中交织单比特的方法和装置一种用于在数字音频广播系统中交织数据的单本位声音的方法和装置