机译:使用视听提示进行语音活动检测和说话人定位
Applied Computing - UNISINOS, Av. Unisinos, 950, Sao Leopoldo 93022-000. RS, Brazil;
Institute of Informatics - UFRCS, Av. Bento Goncalves, 9500, Porto Alegre 91501-970, RS, Brazil;
Institute of Informatics - UFRCS, Av. Bento Goncalves, 9500, Porto Alegre 91501-970, RS, Brazil;
Hewlett-Packard Laboratories, 1501 Page Mill Road, Palo Alto, CA 94304, USA;
Huawei Innovation Center US RS-D, 2330 Central Expressway, Santa Clara, CA 95050, USA;
user interfaces; voice activity detection; speaker localization; multimodal analysis; hidden markov models;
机译:使用SVM和HMM融合的同时说话人语音活动检测和定位
机译:基于麦克风阵列和颜色信息的视听语音活动检测
机译:具有视听线索的自适应说话人识别,可用于电影内容分析
机译:具有健壮的说话人定位和语音活动检测功能的说话人区分系统
机译:用于鲁棒语音活动检测和自动语音识别的视听语音处理方面的进展
机译:基于可靠空间线索的双麦克风语音活动检测
机译:使用深神经网络进行自适应软语音活动,用于强大的扬声器验证