首页> 外国专利> Unsupervised speaker clustering for automatic speaker indexing of recorded audio data

Unsupervised speaker clustering for automatic speaker indexing of recorded audio data

机译:无监督的扬声器群集,可自动对已录制的音频数据进行扬声器索引

摘要

A system and method for unsupervised clustering of audio data segments in an audio data recording containing speech from multiple speakers including the steps of: 1) providing a portion of the audio data containing speech from all of the speakers; 2) forming initial clusters by dividing the portion of the audio data into segments, each of which includes an ordered data set; 3) computing the pairwise distance between each pair of clusters using a likelihood ration independent of the order of data within the segments; and 4) combining into a new cluster the two clusters with a minimum pairwise distance. These steps are repeated until a number of clusters equal to the number of speakers is obtained.
机译:一种用于在包含来自多个扬声器的语音的音频数据记录中对音频数据段进行无监督聚类的系统和方法,包括以下步骤:1)提供一部分音频数据,其中包含来自所有扬声器的语音; 2)通过将音频数据的部分划分成段来形成初始簇,每个段包括有序数据集; 3)使用与段内数据顺序无关的似然比来计算每对集群之间的成对距离;和4)将成对的最小距离的两个群集合并为一个新群集。重复这些步骤,直到获得与扬声器数量相等的簇数。

著录项

  • 公开/公告号US5659662A

    专利类型

  • 公开/公告日1997-08-19

    原文格式PDF

  • 申请/专利权人 XEROX CORPORATION;

    申请/专利号US19960710013

  • 发明设计人 DONALD G. KIMBER;LYNN D. WILCOX;

    申请日1996-09-09

  • 分类号G10L9/00;

  • 国家 US

  • 入库时间 2022-08-22 03:09:35

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号