首页> 外文会议>日本音響学会2018年秋季研究発表会講演論文集 >マルチチャネルNMFにおける階層的クラスタ分析を用いた音声認識性能の向上
【24h】

マルチチャネルNMFにおける階層的クラスタ分析を用いた音声認識性能の向上

机译:在多通道NMF中使用层次聚类分析提高语音识别性能

获取原文
获取原文并翻译 | 示例

摘要

非負値行列因子分解(Nonnegative Matrix Factorization:rnNMF)とは、非負値の行列を分解し、解析rnを行う手法である。行列表現できるデータならば適用rn可能なため、音や画像、文書など多種多様なものに利rn用できる。音響分野では、NMF をマルチチャネル拡rn張することで空間情報を活用し、音源分離を行うマrnルチチャネルNMF (MNMF) が提案されている。rnしかし、MNMF は自由度が高いため、局所最適解にrn陥りやすく、分離性能の初期値依存性が課題となってrnいる。以前著者らは、通常ランダムに初期値を設rn定することの多い分離行列に対して、バイナリマスクrnとEM アルゴリズムを用いて空間相関行列に初期値rnを計算する手法を提案した。この手法によって得rnられた分離信号を認識に適用することで認識性能向rn上を確認した。ただし、空間相関行列に初期値の設定rnを行った場合でも、分離信号の性能がばらついてしまrnう。そこで本稿はこのばらつきを利用し、複数回の分rn離をして得られた信号に階層的クラスタ分析を行い、rn分析結果として得られたクラスタの中で、高い性能rnを持つ信号が属するものにアンサンブル平均を適用rnして新たな信号を算出する手法を提案する。
机译:非负矩阵因式分解(rnNMF)是一种分解非负值矩阵并执行rn的方法。由于它可以应用于可以用矩阵表示的数据,因此可以用于各种事物,例如声音,图像和文档。在声学领域,已经提出了马尔恩多通道NMF(MNMF),其通过将NMF扩展到多个通道来执行声源分离,从而使用空间信息。但是,由于MNMF具有较高的自由度,因此倾向于陷入局部最优解,并且分离性能对初始值的依赖性是个问题。以前,作者提出了一种使用二进制掩码rn和分离矩阵的EM算法计算空间相关矩阵中的初始值rn的方法,该方法通常随机设置初始值。通过将此方法获得的分离信号应用于识别,我们确认了识别性能的提高。然而,即使在空间相关矩阵中设置了初始值rn,分离信号的性能也会变化。因此,在本文中,利用这种变化,我们对通过多次分离rn获得的信号进行了层次聚类分析,并且在作为rn分析结果获得的聚类中,具有高性能rn的信号属于该类。我们提出了一种通过将集合平均应用于对象来计算新信号的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号