audio-visual speaker diarisation; visual focus of attention;
机译:视听注意力集中的平移视频编码主观质量评价
机译:基于视听焦点的高效视频编码
机译:隔离视听电子设备中扬声器引起的振动,而不会降低扬声器锥体的振动
机译:研究使用视觉注意力集中进行视听说话者二分法
机译:基于麦克风阵列,视听和帧选择的强大语音处理功能,可实现车载语音识别和内置说话人识别。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:研究视觉注意力集中在视听说话者欺骗中的用途