Graduate School of Engineering, Osaka University 2-1 Yamadaoka Suita, 565-0871, Japan;
video scene retrieval; multi-modal analysis; symbol sequence matching;
机译:使用高级视听功能对场景进行时间视频分割
机译:基于直方图特征序列的快速音频检索
机译:基于直方图特征序列的快速音频检索
机译:视频场景根据集成音频和可视特征检索符号序列
机译:基于组合的视听内容分析,对视听数据进行自动分段,索引和检索。
机译:使用集成音频和视觉功能的公共安全应用程序进行恶意无人机检测
机译:使用基于多模式关注的视频功能的端到端音频视觉场景感知对话框