image analysis; multimedia databases; multimedia systems; pattern classification;
机译:电视脱口秀中说话人差异化的一种多模式方法
机译:利用多扬声器跟踪,强大的波束形成和时频掩蔽的多模式(视听)源分离
机译:可靠的视听扬声器识别的视觉信号可靠性
机译:强大的视觉功能,用于电视谈话中未注册扬声器的多式联算识别
机译:强大的扬声器识别功能。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:电视广播数据中说话人识别的深层补充功能
机译:使用声学因子分析(预印本)进行稳健的说话人识别的集成特征归一化和增强。