首页> 中国专利> 基于时频掩蔽和深度神经网络的声源方向估计方法及装置

基于时频掩蔽和深度神经网络的声源方向估计方法及装置

页面导航

摘要
著录项
相似文献

摘要

本公开揭示了一种基于时频掩蔽和深度神经网络的声源方位估计方法、装置及电子设备、存储介质，属于计算机技术领域。所述方法包括：获取多通道声音信号；对所述多通道声音信号中的每一通道声音信号进行分帧、加窗和傅里叶变换，形成所述多通道声音信号的短时傅里叶频谱；通过预先训练的神经网络模型对所述短时傅里叶谱进行迭代运算，计算所述多通道声音信号中目标信号对应的比值膜，将多个比值膜融合形成单一比值膜；通过所述单一比值膜对多通道声音信号进行掩蔽加权，确定目标声源的方位。上述基于时频掩蔽和深度神经网络的声源方向估计方法及装置能够在低信噪比、强混响的环境中都具有强大鲁棒性，提高目标声源方向估计的准确性和稳定性。

著录项

公开/公告号CN109839612B

专利类型发明专利
公开/公告日2022-03-01

原文格式PDF
申请/专利权人大象声科(深圳)科技有限公司;
展开▼

申请/专利号CN201811009529.4
发明设计人不公告发明人;
展开▼

申请日2018-08-31
分类号G01S3/802(20060101);
代理机构44352 深圳市德锦知识产权代理有限公司;
代理人丁敬伟
地址 518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼533
入库时间 2022-08-23 13:11:31

相似文献

专利
中文文献
外文文献

1. 基于时频掩蔽和深度神经网络的声源方向估计方法及装置 [P] . 中国专利： CN109839612B . 2022.03.01
2. 基于时频掩蔽和深度神经网络的声源方向估计方法 [P] . 中国专利： CN109839612A . 2019-06-04
3. TIME-FREQUENCY MASKING AND DEEP NEURAL NETWORK-BASED SOUND SOURCE DIRECTION ESTIMATION METHOD [P] . 世界知识产权组织专利： WO2020042708A1 . 2020-03-05

机译：基于时频和深度神经网络的声源方向估计方法
4. SOUND SOURCE DIRECTION ESTIMATION DEVICE, SOUND SOURCE DIRECTION ESTIMATION METHOD AND SOUND SOURCE DIRECTION ESTIMATION PROGRAM [P] . 世界知识产权组织专利： WO2020129231A1 . 2020-06-25

机译：声源方向估计装置，声源方向估计方法和声源方向估计程序
5. SOUND SOURCE DIRECTION ESTIMATION PROGRAM, SOUND SOURCE DIRECTION ESTIMATION METHOD AND SOUND SOURCE DIRECTION ESTIMATION DEVICE [P] . 日本专利： JP2020024338A . 2020-02-13

机译：声源方向估计程序，声源方向估计方法和声源方向估计装置