机译:用于单会话和多会话i-Vector说话人识别的深度学习后端
TALP Research Center, Department of Signal Theory and Communications, Universitat Politecnica de Catalunya—BarcelonaTech, Barcelona, Spain;
TALP Research Center, Department of Signal Theory and Communications, Universitat Politecnica de Catalunya—BarcelonaTech, Barcelona, Spain;
Speaker recognition; Speech; Adaptation models; Training; Machine learning; NIST; Speech processing;
机译:I向量空间中用于说话人验证的深度非线性度量学习
机译:基于自适应课程学习损失和深度剩余网络的文本独立扬声器识别
机译:一种高效算法,用于使用深度学习识别扬声器和语言独立演讲的情绪
机译:基于i向量的鲁棒说话人识别的深度判别分析
机译:使用具有音频,视频和生物医学传感器的深度学习模型,对说话人和情感识别进行多模式传感和数据处理
机译:通过深度特征稀疏驱动的子字典学习进行稳健的单样本人脸识别
机译:深度学习单个和多会话i-vector说话人识别的后端
机译:使用矢量泰勒级数进行说话人识别的噪声鲁棒I-向量提取器。