首页> 中国专利> 基于语义分割编解码网络的声学场景分类方法

基于语义分割编解码网络的声学场景分类方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于语义分割编解码网络的声学场景分类方法，包括如下步骤：S10，分别提取待识别音频数据的梅尔声谱图和标准声谱图；S20，在分别对所述梅尔声谱图和所述标准声谱图进行归一化处理后，将归一化处理后的梅尔声谱图和标准声谱图进行融合处理，得到融合特征；S30，将所述融合特征分别输入SegNet声学模型和UNet声学模型；S40、获取所述SegNet声学模型的第一输出结果以及所述UNet声学模型的第二输出结果，根据所述第一输出结果和第二输出结果确定所述第二输出结果中各个单元音频的声学场景。采用本方法能够使待识别音频数据中的各个单元音频均准确地确定相应声学场景，可以提高声学场景的识别性能。

著录项

公开/公告号CN110718234A

专利类型发明专利
公开/公告日2020-01-21

原文格式PDF
申请/专利权人江苏师范大学;
展开▼

申请/专利号CN201910822432.3
发明设计人马欣欣;马勇;顾明亮;
展开▼

申请日2019-09-02
分类号
代理机构南京经纬专利商标代理有限公司;
代理人许方
地址 221116 江苏省徐州市铜山新区上海路101号
入库时间 2023-12-17 05:26:56

法律信息

法律状态公告日

法律状态信息

法律状态
2020-02-21

实质审查的生效 IPC(主分类):G10L25/18 申请日:20190902

实质审查的生效
2020-01-21

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于语义分割编解码网络的声学场景分类方法 [P] . 中国专利： CN110718234A . 2020-01-21
2. 基于编解码器结构实现钓鱼行为检测处理的方法及相应的语义分割网络系统 [P] . 中国专利： CN111583265A . 2020-08-25
3. DE-CONVOLUTIONAL NEURAL NETWORK-BASED SCENE SEMANTIC SEGMENTATION METHOD [P] . 世界知识产权组织专利： WO2018076212A1 . 2018-05-03

机译：基于反卷积神经网络的场景语义分割方法
4. NETWORK OPTIMIZATION STRUCTURE EMPLOYING 3D TARGET CLASSIFICATION AND SCENE SEMANTIC SEGMENTATION [P] . 世界知识产权组织专利： WO2020119619A1 . 2020-06-18

机译：采用3D目标分类和场景语义分割的网络优化结构
5. Training constrained deconvolutional networks for road scene semantic segmentation [P] . 美国专利： US9916522B2 . 2018-03-13

机译：训练约束反卷积网络进行道路场景语义分割