speech database; audio-visual; forensic speech science; facewear; disguise; acoustic phonetics; perception;
机译:视听语音处理的集成策略:应用于与文本相关的说话人识别
机译:用于语音感知和自动语音识别的视听语料库(L)
机译:期待听鸡尾酒会:独立于演讲者的视听模型,用于语音分离
机译:“视听面罩语料库”:当说话人的脸被面部服饰遮挡时,进行视听语音和说话人识别的调查
机译:基于麦克风阵列,视听和帧选择的强大语音处理功能,可实现车载语音识别和内置说话人识别。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:扬声器独立视听连续语音识别
机译:2004年NIsT演讲者认可评估的会话电话语音语料库集