机译:视听语音处理的集成策略:应用于与文本相关的说话人识别
hidden Markov models; multimedia communication; pattern classification; speaker recognition; speech processing; speech synthesis; HMM classifier framework; audio-visual speech processing; hidden Markov model; speech modeling; text-dependent speaker recognition; Aud;
机译:整合从Kinect获得的3D嘴唇信息的视听语音识别
机译:决策融合视听语音识别的最佳集成权重
机译:决策融合视听语音识别的自适应可靠性度量和最佳集成权
机译:“视听面罩语料库”:当说话人的脸被面部服饰遮挡时,进行视听语音和说话人识别的调查
机译:基于麦克风阵列,视听和帧选择的强大语音处理功能,可实现车载语音识别和内置说话人识别。
机译:成人耳蜗植入者在现实背景噪声中的言语感知:预处理策略和外部选择改善噪声语音识别的有效性
机译:视听语音处理的集成策略:应用于依赖于文本的说话人识别
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。