首页> 外文OA文献 >Vision artificielle pour les non-voyants : une approche bio-inspirée pour la reconnaissance de formes
【2h】

Vision artificielle pour les non-voyants : une approche bio-inspirée pour la reconnaissance de formes

机译:盲人的人工视觉:一种基于生物的模式识别方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

La déficience visuelle touche aujourd'hui plus de 315 millions de personnes à travers le monde, un chiffre qui pourrait doubler d'ici 2030 du fait du vieillissement de la population. De par la diversité de ses causes, le nombre de personnes atteintes, et ses conséquences sur la qualité de vie, cette affection fait partie des problèmes de santé d'importance majeure. Les deux grandes approches holistiques pour compenser la perte ou l'absence de vision sont les systèmes de substitution sensorielle, restituant l'information visuelle par l'intermédiaire d'une autre modalité sensorielle (généralement l'audition ou le toucher), et les neuroprothèses visuelles. Ces dernières reproduisent à la surface du relais visuel implanté les images acquises par une caméra, en respectant leur configuration spatiale, un pixel correspondant à une électrode. Malheureusement, les neuroprothèses actuelles souffrent encore d'une perte de résolution trop importante, puisqu'une image ne sera restituée que par une matrice de quelques dizaines de points, rendant ces systèmes inadaptés à une utilisation au quotidien. Ces limitations sont de même nature dans le cas des dispositifs de substitution sensorielle : la quantité d'informations visuelles nécessaire à l'interprétation d'une scène naturelle est bien trop importante par rapport à la résolution de l'interface de restitution (auditive, tactile, ou par micro-stimulation). Ces systèmes se montrent par conséquent inefficaces dans des environnements visuels complexes, et ils ne sont donc qu'extrêmement peu utilisés en dehors des laboratoires de recherches. Ce constat nous a conduits à proposer dans cette thèse une approche alternative, consistant en un système de suppléance intégrant des méthodes de vision artificielle, afin de prétraiter la scène visuelle, et de ne restituer au non-voyant que les informations extraites pertinentes. Grâce à la reconnaissance de formes en temps réel et à la synthèse de sons spatialisés, ce système permet de restaurer des boucles visuomotrices qui rendent à nouveau possibles certaines fonctions visuelles comme la localisation et la préhension d'objets. La navigation étant une autre tâche critique pour les non-voyants, nous avons également incorporé au dispositif des fonctions de guidage basées sur le positionnement par satellites et sur un système d'information géographique adapté. La trop faible précision de localisation du GPS nous a amenés à développer une nouvelle méthode de positionnement hybride, combinant les données satellites et inertielles à la reconnaissance de cibles visuelles géolocalisées. L'utilisation de la vision artificielle a ainsi permis d'améliorer les performances de localisation et d'obtenir une erreur moyenne généralement inférieure à 5 mètres, rendant possible le guidage et la navigation d'un piéton non-voyant. Afin d'améliorer les performances du module de vision artificielle, constituant le cœur du système, nous avons développé et évalué un nouvel algorithme de reconnaissance de formes bio-inspiré multi-résolutions, reposant sur la librairie Spikenet. Celle-ci utilise un codage de l'information visuelle par latence, et des représentations sous forme d'arêtes orientées, telles que celles observées dans le cortex visuel primaire. Par rapport à l'algorithme originel mono-échelle, cette architecture permet de capturer un spectre de fréquences spatiales plus large. Les traitements à faible résolution permettent ainsi d'améliorer la tolérance aux déformations de l'image, alors que les hautes fréquences spatiales, plus discriminantes, maintiennent une précision suffisamment élevée. De par son fonctionnement en plusieurs passes successives, cette nouvelle architecture permet de plus de diminuer les temps de traitement grâce à une première couche rapide, filtrant les objets à rechercher dans la phase suivante à haute résolution, plus coûteuse en temps de calcul.
机译:如今,视力障碍影响了全球超过3.15亿人,由于人口老龄化,这一数字到2030年可能翻倍。由于其原因的多样性,受影响的人数及其对生活质量的影响,这种情况是主要的健康问题之一。补偿视力丧失或缺乏的两种主要整体方法是感觉替代系统,通过另一种感觉方式(通常是听觉或触摸)恢复视觉信息以及神经假体。视觉的。后者在视觉中继器的表面上重现了由相机获取的图像(相对于它们的空间配置),该图像对应于一个电极。不幸的是,当前的神经假体仍然遭受太大的分辨率损失,因为图像只能通过几十个点的矩阵来恢复,从而使这些系统不适合日常使用。这些限制在感觉替代设备的情况下是相似的:与渲染界面的分辨率(听觉,触觉)相比,解释自然场景所需的视觉信息量太大了,或通过微刺激)。因此,这些系统在复杂的视觉环境中被证明是无效的,因此仅在研究实验室以外很少使用。这种观察导致我们在本文中提出了一种替代方法,该方法由集成了人工视觉方法的供应系统组成,以便对视觉场景进行预处理,并且仅将相关的提取信息恢复给盲人。由于实时的形状识别和空间声音的合成,该系统使得恢复视觉运动回路成为可能,这又使某些视觉功能成为可能,例如定位和抓握物体。由于导航是盲人的另一项重要任务,因此我们还将基于卫星定位的导航功能和合适的地理信息系统整合到了设备中。 GPS的定位精度过低,导致我们开发了一种新的混合定位方法,将卫星和惯性数据与对地理目标的识别相结合。人工视觉的使用因此提高了定位性能,并获得了通常小于5米的平均误差,从而可以引导和导航盲人行人。为了提高构成系统核心的人工视觉模块的性能,我们基于Spikenet库开发并评估了一种新的多分辨率生物启发模式识别算法。这使用了按时延对视觉信息进行编码,以及采用定向边缘形式的表示形式,例如在主要视觉皮层中观察到的形式。与原始的单标度算法相比,此架构可以捕获更宽的空间频谱。因此,低分辨率处理提高了对图像失真的容忍度,而更具区分性的高空间频率则保持了足够高的精度。由于它的连续运行,这种新的体系结构还可以通过快速的第一层来减少处理时间,从而以高分辨率过滤下一阶段要搜索的对象,从而使计算时间更加昂贵。

著录项

  • 作者

    Brilhault Adrien;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号