摘要:分离混叠在一起的不同语音信号,抑制复杂的干扰噪声,即所谓的“鸡尾酒会”问题,一直是语音信号处理和人类听觉研究的难题之一。研究人员一直希望让机器达到像人类听觉系统一样的神奇能力,提出了从单通道语音增强、阵列空间滤波、盲源分离到听觉场景分析等不同方法。最近基于语音信号稀疏性特点的分离方法效果非常出色,如果能够找到所谓的理想二元时频掩模(Ideal binary mask),就能很好的从混叠信号中分离出各个语音信号。本文介绍了我们用双传声器分离混叠语音信号的方法,该方法在混响较弱的环境中能够很好的分离多个语音信号,同时保证可懂度。本文还分析了采用二元掩模方法分离语音信号时造成的失真问题,以及对自动识别系统产生的影响。