首页> 外文OA文献 >Deux niveaux et deux outils d'analyse pour une meilleure segmentation de données audio
【2h】

Deux niveaux et deux outils d'analyse pour une meilleure segmentation de données audio

机译:两个级别和两个分析工具,用于更好的音频数据分段

摘要

- Dans cet article, nous abordons le problème de la segmentation de données audio. Nous proposons un processus de segmentation à deux niveaux qui permet de diviser les pistes audio en courtes séquences qui sont étiquetées dans différentes classes. La segmentation est effectuée en calculant différentes caractéristiques pour chaque séquence audio. Ces caractéristiques sont calculées soit sur un segment audio complet, soit sur une trame (ensemble d'échantillons) qui est un sous-ensemble d'un segment audio. L'approche proposée pour la microsegmentation des données audio consiste en une combinaison d'un classifieur K-Means au niveau des segments et d'un système de chaînes de Markov cachées multidimensionnelles utilisant une décomposition du signal en trames. Une première classification est obtenue en utilisant le classifieur K-Means et les caractéristiques relatives aux segments. Le résultat final est alors fourni par l'utilisation des chaînes de Markov cachées multidimensionnelles et les caractéristiques relatives aux trames, en se basant sur les résultats intermédiaires fournis par la première étape. Les chaînes de Markov cachées multidimensionnelles sont une extension des chaînes de Markov cachées classiques qui permet la prise en compte de données multicomposantes. Elles sont particulièrement adaptées dans notre cas où chaque segment audio peut être représenté par plusieurs caractéristiques de différentes natures.
机译:-在本文中,我们解决了分割音频数据的问题。我们提供了一个两级分段过程,可将音频轨道分成短序列,并在不同类别中进行标记。通过为每个音频序列计算不同的特征来执行分段。这些特征是在完整的音频片段上或在作为音频片段子集的帧(样本集)上计算的。所提出的用于音频数据微分段的方法由段级K-Means分类器和使用信号分解成帧的多维隐马尔可夫链系统组成。使用K均值分类器和与分段有关的特征获得第一分类。然后,根据第一步提供的中间结果,使用多维隐藏的马尔可夫链和与帧有关的特征来提供最终结果。多维隐马尔可夫链是经典隐马尔可夫链的扩展,可以考虑多分量数据。它们特别适合我们的情况,其中每个音频段可以由不同性质的几个特征表示。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号