机译:说话者差异化在非语音和非语音/语音混合视频音轨的音频索引中的适用性
机译:移动设备上多媒体数据的在线说话人数字化检索
机译:基于语音/非语音检测的使用隐私保护音频功能的有效说话人区分
机译:说话人差异化在多媒体检索音频概念检测中的适用性
机译:多媒体信息系统中基于子空间的语义概念检测和检索。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:扬声器二值化对非语音和混合非语音/语音视频音轨的音频索引的适用性
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。