机译:通过使用级联神经网络的特征映射进行单声道去混响,以实现可靠的远距离说话者识别和语音识别
机译:基于说话者的基于深度神经网络的单通道联合语音分离和声学建模方法,用于多语音对话的鲁棒识别
机译:基于深度神经网络的瓶颈特征和基于去噪自动编码器的去混响用于远距离说话者识别
机译:使用动态特征增强和识别的语音去混响约束深度神经网络和特征自适应
机译:使用深度神经网络瓶颈特征进行学习特征映射以实现远距离大词汇量语音识别
机译:用于与说话人无关的语音识别的卷积神经网络。
机译:使用LSTM神经从肉点发音运动中独立于说话者的沉默语音识别网络
机译:基于深度神经网络的瓶颈特征和基于去噪自动编码器的去混响用于远距离说话者识别
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。