首页> 外文OA文献 >FLCAA : système de codage parcimonieux et d'analyse perceptuelle des signaux sonores en temps réel
【2h】

FLCAA : système de codage parcimonieux et d'analyse perceptuelle des signaux sonores en temps réel

机译:FLCAA:稀疏编码系统和实时声音信号感知分析

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Ce mémoire débute par un survol de l'état de l’art des méthodes de compositions musicales assistées par ordinateur (MCMAO). À l’aide d'un ensembles critères permettant l’évaluation des méthodes de compositions musicales assistées par ordinateur, on identifie une technique particulièrement prometteuse. Il s’agit d ’un compositeur statistique, présenté par Hoffman et al. en 2008, utilisant les "mel-frquecy cepstral coefficients" (MFCC), un prétraitement inspiré des techniques en reconnaissance de parole. Toutefois, cette technique présente diverses limitations, comme la qualité de reconstruction des signaux, qui l’empêche d'être utilisée pour composer de la musique utilisable professionnellement. Ainsi, ce mémoire tente de bonifier la méthode de composition musicale assistée par ordinateur de Hoffman et al. en remplaçant la technique MFCC d'analyse/synthèse du signal par une technique novatrice d'analyse/synthèse des signaux sonores nommée "Fast Locally competitive algorithm for audio" (FLCAA). Celle-ci permet une analyse perceptuelle parcimonieuse, en temps réel, ayant une bonne résolution fréquencielle et une bonne résolution temporelle. De plus le FLCAA permet une reconstruction robuste de bonne qualité également en temps réel. L’analyse est constituée de deux parties distinctes. La première consiste à utiliser un prétraitement inspiré de l’audition pour transformer le signal sonore afin d'obtenir une représentation cochléaire. Concrètement, la transformation d'analyse est accomplie à l’aide d'un filtrage par banc de filtres cochléaires combiné à un mécanisme de fenêtre coulissante. Le banc de filtres utilisé est composé de filtres cochléaires passe-bande à réponse impulsionnelle finie, de type "rounded exponential" (RoExp). La deuxième étape consiste à coder la représentation cochléaire de manière parcimonieuse afin d'augmenter la résolution spatiale et temporelle pour mettre en évidence certaines caractéristiques du signal comme les fréquences fondamentales, l’information contenue dans les basses fréquences et les signaux transitoires. Cela est fait, en intégrant un réseau de neurones (nommé LCA) utilisant les mécanismes d'inhibition latérale et de seuillage. À partir des coefficients de la représentation perceptuelle, il est possible d'effectuer la transformation de synthèse en utilisant une technique de reconstruction novatrice qui est expliqué en détail dans ce mémoire.
机译:本文首先概述了计算机辅助音乐创作方法(MCMAO)的技术水平。使用一组评估计算机辅助音乐创作方法的标准,确定了一种特别有前途的技术。它是由Hoffman等人提出的统计作曲家。在2008年,采用了“语音倒谱系数”(MFCC),这是一种受语音识别技术启发的预处理技术。但是,该技术具有各种局限性,例如信号重建的质量,这使其无法用于创作专业可用的音乐。因此,本论文试图改进霍夫曼等人的计算机辅助音乐创作方法。用一种称为“快速本地竞争音频算法”(FLCAA)的创新声音信号分析/合成技术代替MFCC信号分析/合成技术。这允许实时的简约感知分析,具有良好的频率分辨率和良好的时间分辨率。此外,FLCAA还可以实时可靠地重建高质量。分析包括两个单独的部分。第一种是使用听觉启发式的预处理来转换声音信号以获得耳蜗表示。具体而言,分析转换是通过将耳蜗滤波器组滤波与滑动窗口机制结合使用来完成的。所使用的滤波器组由具有有限脉冲响应的“圆形指数”(RoExp)类型的耳蜗带通滤波器组成。第二步是对耳蜗表示进行少量编码,以提高空间和时间分辨率,以突出显示信号的某些特征,例如基频,包含在低频中的信息和瞬态信号。这是通过使用侧向抑制和阈值化机制集成神经网络(称为LCA)来完成的。根据感知表示的系数,可以使用创新的重构技术进行合成变换,本文将对此进行详细说明。

著录项

  • 作者

    Tremblay-Boucher Vincent;

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 fr
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号