...
机译:使用音量评估的SRP-PHAT和视频分析为会议提供多峰发言人二分法
Univ Jaen, Dept Telecommun Engn, Jaen, Spain;
Univ Jaen, Dept Comp Sci, Jaen, Spain;
Univ Jaen, Dept Comp Sci, Jaen, Spain;
Univ Jaen, Dept Telecommun Engn, Jaen, Spain;
Univ Jaen, Dept Telecommun Engn, Jaen, Spain;
Speaker diarization; Meeting rooms; SRP-PHAT; Multimodal processing;
机译:基于Boosting的分布式会议视频的多模式发言人检测
机译:通过SVM使用传感器融合的多模式多通道在线扬声器数字化
机译:电视脱口秀中说话人差异化的一种多模式方法
机译:使用具有空间特征的D矢量对现实世界中的会议进行多模式演讲者区分
机译:会议发言者使用语音定位功能。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:使用压缩域视频特性对现实世界会议进行多模式扬声器的演绎
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。