首页> 外文会议>International Workshop on Machine Learning for Multimodal Interaction;MLMI 2008 >A Hybrid Generative-Discriminative Approach to Speaker Diarization
【24h】

A Hybrid Generative-Discriminative Approach to Speaker Diarization

机译:说话人二元化的混合式生成-判别方法

获取原文

摘要

In this paper we present a sound probabilistic approach to speaker diarization. We use a hybrid framework where a distribution over the number of speakers at each point of a multimodal stream is estimated with a discriminative model. The output of this process is used as input in a generative model that can adapt to a novel test set and perform high accuracy speaker diarization. We manage to deal efficiently with the less common, and therefore harder, segments like silence and multiple speaker parts in a principled probabilistic manner.
机译:在本文中,我们提出了一种合理的概率方法来实现说话人区分。我们使用混合框架,其中使用判别模型估计多模式流每个点上的说话人数量分布。此过程的输出在生成模型中用作输入,该模型可以适应新型测试集并执行高精度的扬声器二值化。我们设法以原则上的概率方式有效地处理较不常见,因此较难处理的片段,例如静音和多个扬声器部分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号