机译:电视脱口秀中说话人差异化的一种多模式方法
机译:自下而上和自上而下的说话人差异化方法的比较研究
机译:使用音量评估的SRP-PHAT和视频分析为会议提供多峰发言人二分法
机译:高压扬声器日复速度初探的多模式方法
机译:同频道语音中的说话人自动识别和区分
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:电视节目自上而下扬声器二值化的多模式初始化方法
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。