首页> 外文OA文献 >Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
【2h】

Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition

机译:基于局部二值模式和梯度分布的有效且高效的视觉描述,用于对象识别

摘要

Cette thèse est consacrée au problème de la reconnaissance visuelle des objets basé sur l'ordinateur, qui est devenue un sujet de recherche très populaire et important ces dernières années grâce à ses nombreuses applications comme l'indexation et la recherche d'image et de vidéo , le contrôle d'accès de sécurité, la surveillance vidéo, etc. Malgré beaucoup d'efforts et de progrès qui ont été fait pendant les dernières années, il reste un problème ouvert et est encore considéré comme l'un des problèmes les plus difficiles dans la communauté de vision par ordinateur, principalement en raison des similarités entre les classes et des variations intra-classe comme occlusion, clutter de fond, les changements de point de vue, pose, l'échelle et l'éclairage. Les approches populaires d'aujourd'hui pour la reconnaissance des objets sont basé sur les descripteurs et les classiffieurs, ce qui généralement extrait des descripteurs visuelles dans les images et les vidéos d'abord, et puis effectue la classification en utilisant des algorithmes d'apprentissage automatique sur la base des caractéristiques extraites. Ainsi, il est important de concevoir une bonne description visuelle, qui devrait être à la fois discriminatoire et efficace à calcul, tout en possédant certaines propriétés de robustesse contre les variations mentionnées précédemment. Dans ce contexte, l objectif de cette thèse est de proposer des contributions novatrices pour la tâche de la reconnaissance visuelle des objets, en particulier de présenter plusieurs nouveaux descripteurs visuelles qui représentent effectivement et efficacement le contenu visuel d image et de vidéo pour la reconnaissance des objets. Les descripteurs proposés ont l'intention de capturer l'information visuelle sous aspects différents. Tout d'abord, nous proposons six caractéristiques LBP couleurs de multi-échelle pour traiter les défauts principaux du LBP original, c'est-à-dire, le déffcit d'information de couleur et la sensibilité aux variations des conditions d'éclairage non-monotoniques. En étendant le LBP original à la forme de multi-échelle dans les différents espaces de couleur, les caractéristiques proposées non seulement ont plus de puissance discriminante par l'obtention de plus d'information locale, mais possèdent également certaines propriétés d'invariance aux différentes variations des conditions d éclairage. En plus, leurs performances sont encore améliorées en appliquant une stratégie de l'image division grossière à fine pour calculer les caractéristiques proposées dans les blocs d'image afin de coder l'information spatiale des structures de texture. Les caractéristiques proposées capturent la distribution mondiale de l information de texture dans les images. Deuxièmement, nous proposons une nouvelle méthode pour réduire la dimensionnalité du LBP appelée la combinaison orthogonale de LBP (OC-LBP). Elle est adoptée pour construire un nouveau descripteur local basé sur la distribution en suivant une manière similaire à SIFT. Notre objectif est de construire un descripteur local plus efficace en remplaçant l'information de gradient coûteux par des patterns de texture locales dans le régime du SIFT. Comme l'extension de notre première contribution, nous étendons également le descripteur OC-LBP aux différents espaces de couleur et proposons six descripteurs OC-LBP couleurs pour améliorer la puissance discriminante et la propriété d'invariance photométrique du descripteur basé sur l'intensité. Les descripteurs proposés capturent la distribution locale de l information de texture dans les images. Troisièmement, nous introduisons DAISY, un nouveau descripteur local rapide basé sur la distribution de gradient, dans le domaine de la reconnaissance visuelle des objets. [...]
机译:本文致力于基于计算机的对象的视觉识别问题,由于其在索引,图像和视频搜索等领域的许多应用,近年来已成为非常流行和重要的研究课题。 ,安全访问控制,视频监控等。尽管近年来已经做出了很多努力和进步,但是它仍然是一个开放的问题,并且仍然被认为是计算机视觉社区中最困难的问题之一,主要是由于它们之间的相似性。班级和班级内部变化,例如遮挡,背景混乱,视角变化,姿势,比例和照明。当今流行的对象识别方法基于描述符和分类器,通常先从图像和视频中提取视觉描述符,然后使用算法进行分类。根据提取的特征自动学习。因此,重要的是设计一个良好的视觉描述,该描述对于计算应具有区分性和有效性,同时具有针对上述变化的某些鲁棒性。在这种情况下,本论文的目的是为对象的视觉识别任务提出创新性的贡献,特别是提出几种新的视觉描述符,这些描述符可以有效地表示图像和视频的视觉内容,以识别物体。对象。提出的描述符旨在捕获不同方面的视觉信息。首先,我们提供了六种多尺度LBP颜色功能,以解决原始LBP的主要缺陷,即颜色信息不足和对非照明条件下变化的敏感性。 -单调。通过将原始LBP扩展为不同颜色空间中的多尺度形式,所提出的特征不仅可以通过获取更多局部信息来具有更大的辨别力,而且还具有针对不同特征的不变性。光照条件的变化。另外,通过应用从粗到细划分的图像策略来计算图像块中提出的特征,以便对纹理结构的空间信息进行编码,可以进一步提高其性能。拟议的功能捕获图像中纹理信息的全局分布。其次,我们提出了一种降低LBP尺寸的新方法,称为LBP正交组合(OC-LBP)。它采用类似于SIFT的方式,基于分布来构建新的本地描述符。我们的目标是通过将昂贵的梯度信息替换为SIFT方案中的局部纹理图案来构建更有效的局部描述符。作为我们第一个贡献的扩展,我们还将OC-LBP描述符扩展到不同的颜色空间,并提出了六个颜色OC-LBP描述符,以提高基于强度的描述符的区分能力和光度不变性。提出的描述符可以捕获图像中纹理信息的局部分布。第三,我们在对象的视觉识别领域中引入了DAISY,它是一种基于梯度分布的新型快速局部描述符。 [...]

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号