【24h】

Video Retrieval using Speech and Image Information

机译:使用语音和图像信息进行视频检索

获取原文
获取原文并翻译 | 示例

摘要

Video contains multiple types of audio and visual information, which are difficult to extract, combine or trade-off in general video information retrieval. This paper provides an evaluation on the effects of different types of information used for video retrieval from a video collection. A number of different sources of information are present in most typical broadcast video collections and can be exploited for information retrieval. We will discuss the contributions of automatically recognized speech transcripts, image similarity matching, face detection and video OCR in the contexts of experiments performed as part of 2001 TREC Video Retrieval Track evaluation performed by the National Institute of Standards and Technology. For the queries used in this evaluation, image matching and video OCR proved to be the deciding aspects of video information retrieval.
机译:视频包含多种类型的音频和视频信息,这些信息在常规视频信息检索中很难提取,组合或折衷。本文对用于从视频集合中检索视频的不同类型信息的效果进行了评估。在大多数典型的广播视频集合中,存在许多不同的信息源,这些信息源可用于信息检索。我们将在由美国国家标准技术研究院进行的2001 TREC视频检索跟踪评估中所进行的实验的背景下,讨论自动识别的语音记录,图像相似性匹配,面部检测和视频OCR的贡献。对于此评估中使用的查询,图像匹配和视频OCR被证明是视频信息检索的决定性方面。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号