机译:韵律和其他长期特征,可实现说话人区分
Int. Comput. Sci. Inst., Berkeley, CA;
audio signal processing; cepstral analysis; MFCC; audio track; long-term features; mel-frequency cepstral coefficients; speaker diarization; speaker discriminability; prosody;
机译:会议室会话中使用长期会话特征进行语音重叠的语音检测重叠
机译:基于韵律的扬声器验证,使用扬声器特定文本进行短语
机译:具有韵律特征的说话人重叠检测,可实现说话人区分
机译:说话人差异化系统中说话人聚类的韵律和语音特征
机译:会议发言者使用语音定位功能。
机译:使用随机森林监督扬声器日期:一种心理治疗过程研究的工具
机译:韵律和其他长期特征,可实现说话人区分
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。