首页> 外文OA文献 >Investigation of audio feature extraction and audiovisual correspondences for bio-inspired auditory to visual substitution systems
【2h】

Investigation of audio feature extraction and audiovisual correspondences for bio-inspired auditory to visual substitution systems

机译:研究生物启发听觉到视觉替代系统的音频特征提取和视听对应

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Résumé: Les systèmes de substitution sensorielle convertissent des stimuli d’une modalité sensorielle en des stimuli d’une autre modalité. Ils peuvent fournir les moyens pour les personnes handicapées de percevoir des stimuli d’une modalité défectueuse par une autre modalité. Le but de ce projet de recherche était d’étudier des systèmes de substitution de l’audition vers la vision. Ce type de substitution n’est pas bien étudié probablement en raison de la complexité du système auditif et des difficultés résultant de la désadaptation entre les sons audibles qui peuvent changer avec des fréquences allant jusqu’à 20000 Hz et des stimuli visuels qui changent très lentement avec le temps afin d’être perçus. Deux problèmes spécifiques des systèmes de substitution de l’audition vers la vision ont été ciblés par cette étude: la recherche de correspondances audiovisuelles et l’extraction de caractéristiques auditives. Une expérience audiovisuelle a été réalisée en ligne pour trouver les associations entre les caractéristiques auditives (la fréquence fondamentale et le timbre) et visuelles (la forme, la couleur, et la position verticale). Une forte corrélation entre le timbre des sons utilisés et des formes visuelles a été observée. Les sujets ont fortement associé des timbres “doux” avec des formes arrondies bleues, vertes ou gris clair, des timbres “durs” avec des formes angulaires pointues rouges, jaunes ou gris foncé et des timbres comportant simultanément des éléments de douceur et de dureté avec un mélange des deux formes visuelles arrondies et angulaires. La fréquence fondamentale n’a pas été associée à la position verticale, ni le niveau de gris ou la couleur. Étant donné la correspondance entre le timbre et une forme visuelle, dans l’étape sui- vante, un modèle hiérarchique flexible et polyvalent bio-inspiré pour analyser le timbre et extraire des caractéristiques importantes du timbre a été développé. Inspiré par les découvertes dans les domaines des neurosciences, neurosciences computationnelles et de la psychoacoustique, non seulement le modèle extrait-il des caractéristiques spectrales et temporelles d’un signal, mais il analyse également les modulations d’amplitude sur différentes échelles de temps. Il utilise un banc de filtres cochléaires pour résoudre les composantes spectrales d’un son, l’inhibition latérale pour améliorer la résolution spectrale, et un autre banc de filtres de modulation pour extraire l’enveloppe temporelle et la rugosité du son à partir des modulations d’amplitude. Afin de démontrer son potentiel pour la représentation du timbre, le modèle a été évalué avec succès pour trois applications : 1) la comparaison avec les valeurs subjectives de la rugosité 2) la classification d’instruments de musique 3) la sélection de caractéristiques pour les sons qui ont été regroupés en fonction de la forme visuelle qui leur avait été attribuée dans l’expérience audiovisuelle. La correspondance entre le timbre et la forme visuelle qui a été révélée par cette étude et le modèle proposé pour l’analyse de timbre peuvent être utilisés pour développer des systèmes de substitution de l’audition vers la vision intuitifs codant le timbre en formes visuelles.
机译:简介:感觉替代系统将一种感觉模态的刺激转换为另一种模态的刺激。它们可以为残障人士提供从一种有缺陷的模态感知另一种模态的刺激的方法。该研究项目的目的是研究从听觉到视觉的替代系统。这种替代类型的研究尚未很好,可能是由于听觉系统的复杂性以及可听见的声音之间的不匹配所造成的困难。可听见的声音可能会以高达20,000 Hz的频率变化,而视觉刺激则变化非常缓慢。随着时间的流逝才能被感知。这项研究针对视觉系统听力替代的两个具体问题:寻找视听对应关系和提取听觉特征。在线进行了视听实验,以发现听觉(基本频率和音色)与视觉(形状,颜色和垂直位置)特征之间的关联。观察到所用声音的音色与视觉形式之间有很强的相关性。主题与圆形,蓝色,绿色或浅灰色形状的“软”邮票,带有尖锐的红色,黄色或深灰色棱角形状的“硬”邮票以及同时包含柔软性和硬度元素的邮票紧密相关。两种圆形和角形视觉形式的混合。基本频率与垂直位置无关,与灰度或颜色无关。给定邮票和视觉形式之间的对应关系,下一步,开发了一种灵活且用途广泛的层次模型,以生物为灵感来分析邮票并提取邮票的重要特征。受神经科学,计算神经科学和心理声学领域发现的启发,该模型不仅提取信号的频谱和时间特征,而且还分析了不同时间范围内的幅度调制。它使用一组耳蜗滤波器来解决声音的频谱成分,使用侧向抑制来提高频谱分辨率,并使用另一组调制滤波器来从调制中提取时间包络和声音的粗糙度振幅。为了证明其表示音色的潜力,该模型已成功用于三种应用评估:1)与粗糙度的主观值进行比较2)乐器的分类3)选择乐器的特性已根据视听体验中分配给它们的视觉形式对声音进行分组。这项研究揭示的音色和视觉形式之间的对应关系以及所提出的用于分析音色的模型可用于开发听力替代视觉的直观系统,以视觉形式编码音色。

著录项

  • 作者

    Adeli Mohammad;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号