Speaker diarization; multi-modal learning; self-supervised learning; audio-video synchronization;
机译:基于Fisher线性半判别分析的视听说话人二分法
机译:基于主动学习的约束聚类用于说话人区分
机译:与K-means的混合DE用于演讲者广播新闻的演讲者聚类
机译:视听扬声器简化的自我监督学习
机译:同频道语音中的说话人自动识别和区分
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:使用预先训练的视听同步模型进行多式扬声器日复速度