首页> 外文学位 >Discovering objects in images and videos.
【24h】

Discovering objects in images and videos.

机译:发现图像和视频中的对象。

获取原文
获取原文并翻译 | 示例

摘要

This thesis presents a novel way of scene analysis in images and videos. Traditional scene analysis using object detection involves a lot of human labor for labeling the images, and also has the difficulty of handling a large number of objects categories. Our approach to scene analysis is unsupervised in nature. Given a video, we want to "discover" the objects of interest. No single labeled image is used to pre-train or initialize the system. Still, the system is able to discover the objects of interest. It works on a wide variety of videos and it can discover objects belonging to a large set of different categories. It works in crowded scenes with distracting background pattern and motion. It works in partial occlusions and total removal. The probabilistic framework consists of an appearance model and a motion model. The appearance model exploits the consistency of object parts in appearance across frames. The motion model exploits the motion continuity across frames. Together, they provide appearance and location estimates of the objects of interest. This framework provides a basis for higher level video content analysis tasks.
机译:本文提出了一种新颖的图像和视频场景分析方法。使用对象检测的传统场景分析需要大量的人工来标记图像,并且还具有处理大量对象类别的困难。我们的场景分析方法实际上是不受监督的。给定视频,我们想“发现”感兴趣的对象。没有单个标记的图像用于预训练或初始化系统。该系统仍然能够发现感兴趣的对象。它可以处理各种视频,并且可以发现属于大量不同类别的对象。它可以在拥挤的场景中工作,并具有分散注意力的背景图案和动作。它适用于部分遮挡和完全移除。概率框架由外观模型和运动模型组成。外观模型在整个框架中利用了对象零件在外观上的一致性。运动模型利用了跨帧的运动连续性。它们一起提供了感兴趣对象的外观和位置估计。该框架为更高级别的视频内容分析任务提供了基础。

著录项

  • 作者

    Liu, David.;

  • 作者单位

    Carnegie Mellon University.;

  • 授予单位 Carnegie Mellon University.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2008
  • 页码 150 p.
  • 总页数 150
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号