首页> 外文会议>日本音響学会2019年春季研究発表会講演論文集 >音源クラス識別器つき多チャンネル変分自己符号化器を用いた高速セミブラインド音源分離
【24h】

音源クラス識別器つき多チャンネル変分自己符号化器を用いた高速セミブラインド音源分離

机译:使用带有声源分类器的多通道可变自编码器进行高速半盲声源分离

获取原文

摘要

ブラインド音源分離(Blind Source Separation:BSS)とは,音源信号や音源からマイクまでの伝達特性が未知の場合に,複数の音源信号が混合された観測信号から音源信号を推定する問題である.周波数領域で定式化されるBSS のアプローチは,周波数ごとの音源分離の問題と周波数ごとに得られる分離信号がそれぞれどの音源のものであるかを対応づけるパーミュテーション整合と呼ぶ問題を併せて解く必要があるが,音源の混合過程を畳み込み演算を含まない瞬時混合系で表せるため比較的効率の良いアルゴリズムを実現できる利点がある.また,音源に関する時間周波数領域で成り立つ様々な仮定やマイクロホンアレーの周波数応答に関する仮定が有効活用できるようになることも大きな利点である.例えば,多チャンネル非負値行列因子分解(Multichannel Non-negative MatrixFactorization: MNMF) は,各音源のパワースペクトログラムを非負値行列とみなし,二つの非負値行列の積で表現するアプローチである.これは,各時間フレームでパワースペクトルを時間変化する振幅でスケーリングされた基底スペクトルの線形和によって近似することに相当する.これによりMNMF は音源のスペクトル構造を手がかりにしながら周波数ごとの音源分離とパーミュテーション整合の同時解決を可能にしている.では優決定条件に特化したMNMF の枠組が初めて導入され,その枠組は後年独立低ランク行列分析(Independent Low-Rank Matrix Analysis:ILRMA)と呼ばれている.MNMF やILRMA は,低ランク構造を持つ特定の音源に対して有効である一方で,限られた基底の線形和で正しく表現できない音源に対しては分離性能が制限される.
机译:盲源分离: BSS)是声源信号或从声源到麦克风的传输。 当特性未知时,将多个声源信号混合在一起的视图。 这是从测量信号估计声源信号的问题。频率范围 该地区制定的BSS方法适用于每个频率。 每种频率下的声源分离问题和分离信号 与每个声源相关联的面值 必须解决一起称为突变匹配的问题。 但是,卷积运算中不包含声源混合处理的时刻 一种相对有效的算法,因为它可以由混合系统表示 有可以实现的优点。另外,与声源有关的时间频率 在多个方面都适用的各种假设和麦克风阵列 可以有效利用关于频率响应的假设。 这也是一个很大的优势。例如,多通道非负 值矩阵分解(多通道非负矩阵) 分解:MNMF)是每个声源的力量。 将视谱图视为非负矩阵,并具有两个非负值 这是矩阵乘积表示的一种方法。这是每个小时 幅度会随着帧间时间的变化而改变功率谱 由标度谱的线性总和 对应于近似值。这使MNMF成为声源 对于每个频率,使用 可以同时解决声源分离和排列匹配的问题 我必须。现在,让我们转到MNMF,它专门研究获胜条件。 该框架是首次引入的,后来该框架是独立的且等级较低。 独立的低阶矩阵分析: 它称为ILRMA)。 MNMF和ILRMA 一种对低阶结构的特定声源有效的 另一方面,用有限的线性基数和不能正确表达的声音 源的分离性能受到限制。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号