The University of Texas at Dallas;
机译:利用基于频率的内核和基于DIP的聚类在自然音频流中进行健壮的语音活动检测
机译:低语语音音频流中的说话人识别
机译:说话者差异化在非语音和非语音/语音混合视频音轨的音频索引中的适用性
机译:Prof-Life-Log:用于自然音频流的音频环境检测
机译:高度自然主义的音频流中的会话语音理解
机译:扬声器在自然主义语音和脸部的声音之间的吸引力和独特性是不相关的
机译:基于Toeplitz逆协方便的自然主义音频流的强大扬声器聚类
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。