机译:无言的声音:使用保护隐私的音频表示实现鲁棒的扬声器分离
International Computer Science Institute, Berkeley, CA, USA;
LP residual; Privacy sensitive audio features; deep neural networks; listening tests; speaker diarization;
机译:演讲者区分的隐私保护音频表示调查
机译:音频广播新闻中演讲者跟踪的演讲者区分系统的开发:一个案例研究
机译:音频广播新闻中演讲者跟踪的演讲者差异化系统的开发:一个案例研究
机译:音频-视频扬声器的二值化,可实现无监督的扬声器和面部模型创建
机译:非中性环境中的鲁棒扬声器建模及其在大规模多扬声器音频流中的应用
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:无言的声音:使用隐私保护音频表示的强大扬声器二值化
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。