Technical University of Catalonia, Barcelona, Spain;
机译:基于互信息的多模式立体声视频注册,以进行人跟踪
机译:基于现场吉他演奏的视听信息的多模式速度和节拍跟踪系统
机译:具有音频和视频信息的自动多模式语音识别系统
机译:智慧室中的音频,视频和多模式人员识别
机译:使用具有音频,视频和生物医学传感器的深度学习模型,对说话人和情感识别进行多模式传感和数据处理
机译:服务提供商对远程医疗系统中从音频到视频功能过渡的看法:定性评估
机译:智能房间内的音频,视频和多模人识别
机译:视频跟踪系统的自我评估