Speaker Roles; Speaker diarization; Viterbi decoding; meeting recordings; multi-party conversations;
机译:基于通用维特比的时间序列分割和聚类模型,用于说话人区分
机译:使用音量评估的SRP-PHAT和视频分析为会议提供多峰发言人二分法
机译:演讲者区分和会议数据链接
机译:基于扬声器角色N-GRAM模型的会议扬声器日益改复
机译:会议发言者使用语音定位功能。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:基于扬声器角度N-GRam模型的会议扬声器演示
机译:会议自动对话行为分割的语言模型演讲者自适应