首页> 外文期刊>電子情報通信学会技術研究報告. 情報論的学習理論と機械学習 >音楽音響信号解析のためのガンマ過程に基づく無限重畳離散全極モデル
【24h】

音楽音響信号解析のためのガンマ過程に基づく無限重畳離散全極モデル

机译:基于伽马音响信号分析伽玛工艺的无限重型榻榻米离散整极模型

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,多数の楽器音が重畳している音楽音響信号を,音の三要素である音高(基本周波数)·音色(スペクトル包絡)·音量に分解するための確率モデルについて述べる.楽器音がソース·フィルタ理論に従うとすると,そのフーリエスペクトルは音源信号に対応するスペクトル微細構造と音色を表すスペクトル包格との積で表現できる.この仮定のもとで,短時間フーリエ変換(STFT)で得られる混合音スペクトログラムを音の三要素に分解するには,複合自己回帰モデルを用いることができる.しかし,音高を持つ楽器音に対してスペクトル包格を推定する際に,調波構造のピークのみに着目するのではなく,全周波数帯域が等しく考慮に入れられていた.また,人間の聴覚特性に則した対数周波数スペクトログラムを扱うことができなかった.これらの問題を解決するため,本研究では,離散全極モデルを複合自己回帰モデルの枠組みに組み入れることで,連続ウェーブレット変換で得られる混合音スペクトログラムを分解できる無限重畳離散全極モデルを提案する.本モデルはガンマ過程を用いたノンパラメトリックベイズモデルであり,観測データに合わせて適切な個数のスペクトル包絡と調波構造スペクトルを推定できる.
机译:在本文中,我们描述了大量仪器声音叠加的音乐声信号(基频),音调(光谱包络)是声音的三个因素,以及概率模型。如果仪器声音遵循源滤波器理论,则傅里叶频谱可以由对应于声源信号和表示音调的光谱封装的频谱精细结构的乘积表示。在这种假设下,复合自回归模型可用于拆卸用短时间傅里叶变换(STFT)获得的混合声光谱图中的声音的三个元素。然而,当估计具有间距的仪器声音的仪器声音时,整个频带同样考虑而不是专注于谐波结构的峰值。此外,不可能根据人类听觉特性处理对数频谱图。为了解决这些问题,本研究提出了一种无限的重型离散全极模型,可以通过将离散的全极模型结合到复合自回归模型的框架中,拆卸通过连续小波变换获得的混合声光谱。该模型是使用伽马过程的非参数贝叶斯模型,并且可以根据观察数据估计适当数量的频谱信封和谐波结构光谱。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号