首页> 中国专利> 基于时频掩蔽和深度神经网络的声源方向估计方法及装置

基于时频掩蔽和深度神经网络的声源方向估计方法及装置

摘要

本公开揭示了一种基于时频掩蔽和深度神经网络的声源方位估计方法、装置及电子设备、存储介质,属于计算机技术领域。所述方法包括:获取多通道声音信号;对所述多通道声音信号中的每一通道声音信号进行分帧、加窗和傅里叶变换,形成所述多通道声音信号的短时傅里叶频谱;通过预先训练的神经网络模型对所述短时傅里叶谱进行迭代运算,计算所述多通道声音信号中目标信号对应的比值膜,将多个比值膜融合形成单一比值膜;通过所述单一比值膜对多通道声音信号进行掩蔽加权,确定目标声源的方位。上述基于时频掩蔽和深度神经网络的声源方向估计方法及装置能够在低信噪比、强混响的环境中都具有强大鲁棒性,提高目标声源方向估计的准确性和稳定性。

著录项

  • 公开/公告号CN109839612B

    专利类型发明专利

  • 公开/公告日2022-03-01

    原文格式PDF

  • 申请/专利权人 大象声科(深圳)科技有限公司;

    申请/专利号CN201811009529.4

  • 发明设计人 不公告发明人;

    申请日2018-08-31

  • 分类号G01S3/802(20060101);

  • 代理机构44352 深圳市德锦知识产权代理有限公司;

  • 代理人丁敬伟

  • 地址 518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋裙楼533

  • 入库时间 2022-08-23 13:11:31

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号