首页> 外文期刊>電子情報通信学会技術研究報告 >多チヤンネノレウイーナーフィルタを用いた音源分離におけるスパースモデルと最小二乗誤差モデルの性能比較
【24h】

多チヤンネノレウイーナーフィルタを用いた音源分離におけるスパースモデルと最小二乗誤差モデルの性能比較

机译:使用多通道维纳滤波器的声源分离中的稀疏模型和最小二乘误差模型之间的性能比较

获取原文
获取原文并翻译 | 示例
       

摘要

歪みの少ない劣決定音源分離手法であるDuongらの多チャンネルウィーナーフィルタは,観測信号が多変量正規分布に従う多チャンネル音像の重ね合わせであるという仮定を用いて,各音源の音像を隠れ変数としたEMァルゴリズムにより時間周波数スロット毎の共分散行列を推定し,得られたパラメタによる最大事後確率推定として各音源の音像を求める.この手法は多くの劣決定音源分離手法が用いるスパース性の仮定を利用しない点で特徴的である.本稿では,Duong法の3つの特徴である多変量正規分布による音像のモデル化,多チャンネルウィーナーフィルタとスパース性を仮定しない観測モデルの有効性を調査するため,Duong法と同様の生成モデルの音像がスパースに観測されると仮定した音源分離手法を新たに定式化し,従来のバイナリマスク手法と共にDuong法と比較する.実験の結果,Duong法の3つの特徴全ての有効性を確認した.%Multichannel Wiener filter proposed by Duong et al. can conduct underdetermined blind source separation (BSS) with low distortion. This method assumes that the observed signal is the superimposition of the multichannel source images generated from multivariate normal distributions. The covariance matrix in each time-frequency slot is estimated by EM algorithm which treats the source images as the latent variables. Using the estimated parameters, the source images are separated as the maximum a posteriori estimate. It is worth nothing that this method does not use assumption of sparseness, which is usually used in underdetermined BSS.In this paper we investigate the effectiveness of the three features of Duong's method, i.e., the source image model with multivariate normal distribution, the observation model without sparseness assumption, and the multicnannel Wiener filter. We newly formulate the BSS method with the similar source image model and the different observation model assuming sparseness, and compare with the Duong's method and the conventional binary masking. Experimental results confirmed the effectiveness of all the three features of Duong's method.
机译:Duong等人的多通道Wiener滤波器是一种不确定性较低的失真较小的声源分离方法,它假设观察到的信号是遵循多元正态分布的多通道声像的叠加,因此将每个声源的声像用作隐藏变量。利用EM算法对每个时频时隙的协方差矩阵进行估计,并根据获得的参数获得每个声源的声像作为最大后验概率估计,该方法利用了许多不确定的声源分离方法所使用的稀疏假设。在本文中,为了研究Duong方法的三种模型的有效性,即通过多元正态分布对声像进行建模,多通道维纳滤波器的有效性以及未假设稀疏性的观察模型,提出了一种新的信源分离方法,该方法假设稀疏地观察到与该方法相似的生成模型的声像,并将其与传统的二值蒙版方法和Duong方法进行比较,实验结果显示了Duong方法的所有三个特征。 Duong等人提出的%多通道维纳滤波器可以进行欠定的,低失真的盲源分离(BSS),该方法假定观察到的信号是由多元正态分布生成的多通道源图像的叠加。 EM算法估计每个时频时隙的协方差矩阵,将源图像作为潜在变量,使用估计的参数将源图像分离为最大后验估计,这种方法没有任何价值使用稀疏假设,即本文研究了Duong方法的三个特征的有效性,即具有多元正态分布的源图像模型,无稀疏假设的观测模型和多通道维纳滤波器的有效性。该方法在相似的源图像模型和不同的观察模型下均假设为稀疏,并且与Duong方法和常规二值掩蔽方法进行了比较,实验结果证实了Duong方法的所有三个特征都是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号