...
首页> 外文期刊>電子情報通信学会技術研究報告. 情報論的学習理論と機械学習 >音楽音響信号解析のためのガンマ過程に基づく無限重畳離散全極モデル
【24h】

音楽音響信号解析のためのガンマ過程に基づく無限重畳離散全極モデル

机译:基于伽玛过程的无限叠加离散全极模型用于音乐声信号分析

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,多数の楽器音が重畳している音楽音響信号を,音の三要素である音高(基本周波数)·音色(スペクトル包絡)·音量に分解するための確率モデルについて述べる.楽器音がソース·フィルタ理論に従うとすると,そのフーリエスペクトルは音源信号に対応するスペクトル微細構造と音色を表すスペクトル包格との積で表現できる.この仮定のもとで,短時間フーリエ変換(STFT)で得られる混合音スペクトログラムを音の三要素に分解するには,複合自己回帰モデルを用いることができる.しかし,音高を持つ楽器音に対してスペクトル包格を推定する際に,調波構造のピークのみに着目するのではなく,全周波数帯域が等しく考慮に入れられていた.また,人間の聴覚特性に則した対数周波数スペクトログラムを扱うことができなかった.これらの問題を解決するため,本研究では,離散全極モデルを複合自己回帰モデルの枠組みに組み入れることで,連続ウェーブレット変換で得られる混合音スペクトログラムを分解できる無限重畳離散全極モデルを提案する.本モデルはガンマ過程を用いたノンパラメトリックベイズモデルであり,観測データに合わせて適切な個数のスペクトル包絡と調波構造スペクトルを推定できる.
机译:在本文中,我们描述了一种概率模型,用于分解音乐声信号,在该信号上,大量乐器声音被叠加为声音的三个元素:音高(基本频率),音色(频谱环绕)和音量。假设乐器声音遵循源滤波器理论,则其傅里叶频谱可以由对应于声源信号的频谱微结构与代表音色的频谱包含物的乘积表示。在此假设下,可以使用复合自回归模型将通过短时傅立叶变换(STFT)获得的混合声谱图分解为三个声音元素。然而,当估计具有音高的乐器声音的频谱包含时,不仅关注调音结构的峰值,而且同样考虑了整个频带。另外,不可能处理符合人类听觉特征的对数频谱仪。为了解决这些问题,在本研究中,我们提出了一个无限叠加的离散全极模型,该模型可以通过将离散全极模型合并到复合自返回模型的框架中,分解通过连续小波变换获得的混合声谱图。该模型是使用伽玛过程的非参数贝叶斯模型,可以根据观察到的数据估计适当数量的光谱包含物并调整结构光谱。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号