机译:使用可靠性信息的视频会议中的鲁棒联合音频视频讲话者本地化--II:贝叶斯网络融合
机译:音频和视频传感器网络中的可靠室内说话人识别
机译:说话者差异化在非语音和非语音/语音混合视频音轨的音频索引中的适用性
机译:看谁在说话:使用视频和音频相关的扬声器检测
机译:使用具有音频,视频和生物医学传感器的深度学习模型,对说话人和情感识别进行多模式传感和数据处理
机译:看谁正在说话!高自闭症儿童的隐式和显式视听语音同步检测的注视模式
机译:双级谈话指标:来自扬声器的3D视觉音频集成行为尺度线索
机译:基于二次多帧相关滤波的视频多目标检测。