首页> 中文期刊>声学学报:英文版 >Blind speech source separation via nonlinear time-frequency masking

Blind speech source separation via nonlinear time-frequency masking

     

摘要

瞄准 underdetermined convolutive 混合模型,一个盲目讲话来源分离方法基于掩盖的非线性的时间频率被建议,在在在时间频率领域的独立讲话信号之中的近似 W 拆散 orthogonality (W 做) 性质被利用的地方。在这个方法,从 multimicrophones 的观察混合信号被使正常化起初独立于在时间频率域的频率,然后,动态聚类算法被采用在每时间频率槽获得积极来源信息,经由从簇中心的偏转角度的一个非线性的函数为掩盖的时间频率被选择,最后,混合讲话信号的盲目分离能被反的 STFT (短时间的 Fourier 转变)完成。这个方法不能仅仅解决可以在很经典的频率域窗帘分离技术被遇见的频率排列的问题,而且压制分离矩阵的空间方向散开。模拟结果证明建议分离方法比典型蓝色方法好, signal-noise-ratio 获得(SNRG ) 平均增加 1.58 dB。

著录项

相似文献

  • 中文文献
  • 外文文献
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号