首页> 外文OA文献 >Vision artificielle pour les non-voyants : une approche bio-inspirée pour la reconnaissance de formes

【2h】

Vision artificielle pour les non-voyants : une approche bio-inspirée pour la reconnaissance de formes

机译：盲人的人工视觉：一种基于生物的模式识别方法

代理获取

本网站仅为用户提供外文OA文献查询和代理获取服务，本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文，但由于OA文献来源多样且变更频繁，仍可能出现获取不到、文献不完整或与标题不符等情况，如果获取不到我们将提供退款服务。请知悉。

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

La déficience visuelle touche aujourd'hui plus de 315 millions de personnes à travers le monde, un chiffre qui pourrait doubler d'ici 2030 du fait du vieillissement de la population. De par la diversité de ses causes, le nombre de personnes atteintes, et ses conséquences sur la qualité de vie, cette affection fait partie des problèmes de santé d'importance majeure. Les deux grandes approches holistiques pour compenser la perte ou l'absence de vision sont les systèmes de substitution sensorielle, restituant l'information visuelle par l'intermédiaire d'une autre modalité sensorielle (généralement l'audition ou le toucher), et les neuroprothèses visuelles. Ces dernières reproduisent à la surface du relais visuel implanté les images acquises par une caméra, en respectant leur configuration spatiale, un pixel correspondant à une électrode. Malheureusement, les neuroprothèses actuelles souffrent encore d'une perte de résolution trop importante, puisqu'une image ne sera restituée que par une matrice de quelques dizaines de points, rendant ces systèmes inadaptés à une utilisation au quotidien. Ces limitations sont de même nature dans le cas des dispositifs de substitution sensorielle : la quantité d'informations visuelles nécessaire à l'interprétation d'une scène naturelle est bien trop importante par rapport à la résolution de l'interface de restitution (auditive, tactile, ou par micro-stimulation). Ces systèmes se montrent par conséquent inefficaces dans des environnements visuels complexes, et ils ne sont donc qu'extrêmement peu utilisés en dehors des laboratoires de recherches. Ce constat nous a conduits à proposer dans cette thèse une approche alternative, consistant en un système de suppléance intégrant des méthodes de vision artificielle, afin de prétraiter la scène visuelle, et de ne restituer au non-voyant que les informations extraites pertinentes. Grâce à la reconnaissance de formes en temps réel et à la synthèse de sons spatialisés, ce système permet de restaurer des boucles visuomotrices qui rendent à nouveau possibles certaines fonctions visuelles comme la localisation et la préhension d'objets. La navigation étant une autre tâche critique pour les non-voyants, nous avons également incorporé au dispositif des fonctions de guidage basées sur le positionnement par satellites et sur un système d'information géographique adapté. La trop faible précision de localisation du GPS nous a amenés à développer une nouvelle méthode de positionnement hybride, combinant les données satellites et inertielles à la reconnaissance de cibles visuelles géolocalisées. L'utilisation de la vision artificielle a ainsi permis d'améliorer les performances de localisation et d'obtenir une erreur moyenne généralement inférieure à 5 mètres, rendant possible le guidage et la navigation d'un piéton non-voyant. Afin d'améliorer les performances du module de vision artificielle, constituant le cœur du système, nous avons développé et évalué un nouvel algorithme de reconnaissance de formes bio-inspiré multi-résolutions, reposant sur la librairie Spikenet. Celle-ci utilise un codage de l'information visuelle par latence, et des représentations sous forme d'arêtes orientées, telles que celles observées dans le cortex visuel primaire. Par rapport à l'algorithme originel mono-échelle, cette architecture permet de capturer un spectre de fréquences spatiales plus large. Les traitements à faible résolution permettent ainsi d'améliorer la tolérance aux déformations de l'image, alors que les hautes fréquences spatiales, plus discriminantes, maintiennent une précision suffisamment élevée. De par son fonctionnement en plusieurs passes successives, cette nouvelle architecture permet de plus de diminuer les temps de traitement grâce à une première couche rapide, filtrant les objets à rechercher dans la phase suivante à haute résolution, plus coûteuse en temps de calcul.

机译：如今，视力障碍影响了全球超过3.15亿人，由于人口老龄化，这一数字到2030年可能翻倍。由于其原因的多样性，受影响的人数及其对生活质量的影响，这种情况是主要的健康问题之一。补偿视力丧失或缺乏的两种主要整体方法是感觉替代系统，通过另一种感觉方式（通常是听觉或触摸）恢复视觉信息以及神经假体。视觉的。后者在视觉中继器的表面上重现了由相机获取的图像（相对于它们的空间配置），该图像对应于一个电极。不幸的是，当前的神经假体仍然遭受太大的分辨率损失，因为图像只能通过几十个点的矩阵来恢复，从而使这些系统不适合日常使用。这些限制在感觉替代设备的情况下是相似的：与渲染界面的分辨率（听觉，触觉）相比，解释自然场景所需的视觉信息量太大了，或通过微刺激）。因此，这些系统在复杂的视觉环境中被证明是无效的，因此仅在研究实验室以外很少使用。这种观察导致我们在本文中提出了一种替代方法，该方法由集成了人工视觉方法的供应系统组成，以便对视觉场景进行预处理，并且仅将相关的提取信息恢复给盲人。由于实时的形状识别和空间声音的合成，该系统使得恢复视觉运动回路成为可能，这又使某些视觉功能成为可能，例如定位和抓握物体。由于导航是盲人的另一项重要任务，因此我们还将基于卫星定位的导航功能和合适的地理信息系统整合到了设备中。 GPS的定位精度过低，导致我们开发了一种新的混合定位方法，将卫星和惯性数据与对地理目标的识别相结合。人工视觉的使用因此提高了定位性能，并获得了通常小于5米的平均误差，从而可以引导和导航盲人行人。为了提高构成系统核心的人工视觉模块的性能，我们基于Spikenet库开发并评估了一种新的多分辨率生物启发模式识别算法。这使用了按时延对视觉信息进行编码，以及采用定向边缘形式的表示形式，例如在主要视觉皮层中观察到的形式。与原始的单标度算法相比，此架构可以捕获更宽的空间频谱。因此，低分辨率处理提高了对图像失真的容忍度，而更具区分性的高空间频率则保持了足够高的精度。由于它的连续运行，这种新的体系结构还可以通过快速的第一层来减少处理时间，从而以高分辨率过滤下一阶段要搜索的对象，从而使计算时间更加昂贵。

著录项

作者
Brilhault Adrien;
展开▼
作者单位

展开▼
年度 2014
总页数
原文格式 PDF
正文语种
中图分类

相似文献

外文文献
中文文献
专利

1. Génération de plan de site web pour les non-voyants par des fourmis artificielles [J] . Sonia Colas, Nicolas Monmarché, Mohamed Slimane Revue d'Intelligence Artificielle . 2008,第2期

机译：人工蚂蚁为盲人生成网站地图
2. éditorial - Rencontre scientifique IFP energies nouvelles MAPI 2012 approches multi-échelles pour l’innovation des procédés - Vers le 3e paradigme du génie des procédés : les approches multi-échelles de longueur et de temps comme outil efficace pour une innovation de procédés durables [J] . Jean-Claude Charpentier, Cécile Barrère-Tricca Oil & gas science and technology . 2013,第6期

机译：社论-IFP推动新的MAPI科学会议2012年过程创新的多尺度方法-走向过程工程的第三范式：多尺度的长度和时间方法是可持续过程创新的有效工具
3. Contraintes géométriques de formes pour les contours actifs orientés région : une approche basée sur les moments de Legendre [J] . Alban Foulonneau, Pierre Charbonnier, Fabrice Heitz Traitement du Signal; Signal-Image-Parole . 2004,第2期

机译：面向活动区域的轮廓的几何形状约束：一种基于勒让德矩的方法
4. Une approche pour une continuite de service pour les utilisateurs de terminaux mobiles [C] . Nicolas Le Sommer, Herve Roussain, PHerve Roussain French-speaking conference on Mobility and ubiquity computing . 2005

机译：一种为移动终端用户提供服务连续性的方法
5. Modeles physiques pour la resolution de problemes en vision artificielle: Une approche basee sur la topologie algebrique calculatoire. [D] . Poulin, Pierre. 2002

机译：解决人工视觉问题的物理模型：一种基于计算代数拓扑的方法。
6. Création d’un programme provincial de navigation santé pour les patients atteints de cancer à l’aide d’une approche d’amélioration de la qualité Deuxième partie – Élaboration d’un cadre éducatif de la navigation [O] . Linda C. Watson, Jennifer Anderson, Sarah Champ, 2016

机译：使用质量改进方法为癌症患者创建省级健康导航计划第2部分-开发教育导航框架
7. Vers une approche générique pour la reconnaissance de formes manuscrites structurées : Application aux équations mathématiques et aux caractères chinois [O] . Delaye Adrien, Mouchère Harold 2010

机译：Vers uneapprochegénériquepourla reconnaissance demesmanuscritesconstructurées：applicationauxéquationsmathématiquesetauxcaractèreschinois

Vision artificielle pour les non-voyants : une approche bio-inspirée pour la reconnaissance de formes

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅