Audio-video speaker diarization; Audio speaker recognition; Face recognition;
机译:说话人区分系统中未经监督的,经过训练的基于LS-SVR的分割
机译:扬声器深度化系统中无监督的帮助训练的LS-SVR系列
机译:扬声器日益改估无监督的深度特征嵌入
机译:音频-视频扬声器的二值化,可实现无监督的扬声器和面部模型创建
机译:同频道语音中的说话人自动识别和区分
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:用于无监督扬声器和人脸模型创建的音频 - 视频扬声器二值化