机译:超人多说话者语音识别:一种图形建模方法
IBM Thomas J. Watson Research Center, Yorktown Heights, NY 10598, USA;
IBM Thomas J. Watson Research Center, Yorktown Heights, NY 10598, USA;
IBM Thomas J. Watson Research Center, Yorktown Heights, NY 10598, USA;
Google New York, 75 Ninth Avenue, New York. NY 10011, USA;
factorial hidden markov model: speech separation; algonquin; multiple talker speaker identification; speaker-dependent labeling;
机译:基于说话者的基于深度神经网络的单通道联合语音分离和声学建模方法,用于多语音对话的鲁棒识别
机译:隐马尔可夫模型:自动语音识别的图形建模方法
机译:在多讲话者设置中建模语音定位,谈话者识别和词识别
机译:基于说话者的深度学习方法,用于多说话者自动语音识别的联合语音分离和声学建模
机译:大词汇量语音识别的图形模型。
机译:面部面罩对多讲车禁止噪声语音识别的影响
机译:使用阶乘语音的单声道多语音语音识别 处理模型
机译:改进隐马尔可夫模型:语音识别和语音编码的语义约束,最大似然方法