speaker recognition; cross-modal learning; selfsupervised machine learning;
机译:具有自我监督的三元对抗网络,用于零射频跨模型检索
机译:通过混洗语义嵌入来自我监督零拍摄学习
机译:正弦波中的跨模态对应关系:语音与非语音模式
机译:使用跨莫代尔自我监督解除言乱的演讲嵌入
机译:跨模态对成年听力损失成年人的语音噪声感知的影响。
机译:秘密语音通信中混合语音的存在性检测和嵌入率估计
机译:视觉自我监督是否改善了情感认可的语音表示学习