首页> 外文会议> >Mentoring-Reverse Mentoring:多チャンネル音源分離における教師なし学習のための知識伝搬フレームワーク
【24h】

Mentoring-Reverse Mentoring:多チャンネル音源分離における教師なし学習のための知識伝搬フレームワーク

机译:指导反向指导:多通道源隔离中教师学习的知识传播框架

获取原文

摘要

教師なし学習のための新たな知識伝搬の枠組みを提案し,多チャンネル音源分離に適用した.雑音環境下で複数話者が同時に発話している信号から各音源を分離する音源分離技術は,ロボット対話システム,テレビ会議における議事録作成支援システムをはじめとして,多くのアプリケーションで重要な役割を果たす.特に,音声信号の確率モデルに基づく教師なし音源分離法として,ブラインド音源分離(BSS) が研究されてきた.しかし,これらの手法の分離性能はパラメータの初期値に大きく左右される.一方で,Deep clustering [1] やパーミュテーション不変学習(PIT) [2] といった深層ニューラルネットワーク(DNN) を用いた教師あり音源分離法や,DNN とその後段に確率統計モデルに基づくBSS 手法を持つハイブリット手法では,DNN のもつ高い表現力により優れた分離性能を達成している.これらの手法は,音声信号の複雑な周波数特性を学習できるが,観測された混合信号と音源信号のペアから構成される教師データが大量に必要となる.しかし,実環境において観測されるのは混合信号のみであり,正解信号を得ることは困難である.鏡像法などを用いたシミュレーションによりペアデータを作成することも行われてきたが,適用先の部屋の形状を忠実に再現することは困難である.また,日常生活において音源の種類が無数に存在する条件では,それらを網羅した教師データを収集することも困難である.したがって,音源分離システムの実用を考えると,クリーンな正解信号を必要とせず,マイクに観測された混合信号のみを用いて音源分離システムを教師なし学習できることが望ましい.
机译:教师新知识传播的框架没有学习 提出并应用于多通道声源分离。 信号在噪声环境下同时使用多个扬声器 源分离技术将每个声源与机器人交互分开 系统,系统和视频会议的制备支持系统 系统,包括许多应用程序 扮演一个角色。特别地,基于音频信号的概率模型 没有教师的源隔离方法的显着声源分离 (BSS)已经研究过。但是,这些方法 分离性能大大依赖于参数的初始值。 另一方面,深簇[1]和排列 深度神经网络,如改变学习(坑)[2] 老师与老师与DNN源分离方法和DNN 之后,它具有基于概率统计模型的BSS方法 在混合方法中,由于DNN的高表达力量 已经实现了优异的分离性能。这些方法是 学习音频信号的复杂频率特性,但观察 由一对混合信号和声源信号组成的教学 许多女儿数据是必需的。但是,在真实的环境中 仅观察到混合信号并正确信号信号 很难得到。仿真使用镜像方法 还完成了创建对数据 但忠实地重现适用房间的形状 很难。此外,种子来源在日常生活中 在有无数类别的条件下,教学涵盖了 收集主数据也很难。所以, 考虑到声源分离系统的实际使用清洁积极 通过麦克风观察的混合信号而不需要解决方案信号 您可以使用使用源分离系统的教师学习 这是可取的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号