首页> 外文OA文献 >A cluster-voting approach for speaker diarization and linking of Australian broadcast news recordings
【2h】

A cluster-voting approach for speaker diarization and linking of Australian broadcast news recordings

机译:演讲者区分和链接澳大利亚广播新闻录音的集群投票方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。
获取外文期刊封面目录资料

摘要

We present a clustering-only approach to the problem of speaker diarization to eliminate the need for the commonly employed and computationally expensive Viterbi segmentation and realignment stage. We use multiple linear segmentations of a recording and carry out complete-linkage clustering within each segmentation scenario to obtain a set of clustering decisions for each case. We then collect all clustering decisions, across all cases, to compute a pairwise vote between the segments and conduct complete-linkage clustering to cluster them at a resolution equal to the minimum segment length used in the linear segmentations. We use our proposed cluster-voting approach to carry out speaker diarization and linking across the SAIVT-BNEWS corpus of Australian broadcast news data. We compare our technique to an equivalent baseline system with Viterbi realignment and show that our approach can outperform the baseline technique with respect to the diarization error rate (DER) and attribution error rate (AER).
机译:我们提出了一种仅用于聚类的方法来解决说话人歧视的问题,从而消除了对通常采用的且计算量大的维特比分割和重新排列阶段的需求。我们使用记录的多个线性分段,并在每个分段方案中执行完整链接聚类,以获得每种情况的一组聚类决策。然后,我们收集所有情况下的所有聚类决策,以计算段之间的成对投票,并进行完全链接聚类,以等于线性分割中使用的最小段长度的分辨率对它们进行聚类。我们使用建议的群集投票方法对澳大利亚广播新闻数据的SAIVT-BNEWS语料库进行说话人区分和链接。我们将我们的技术与具有维特比重排的等效基线系统进行了比较,结果表明,相对于二值化错误率(DER)和归因错误率(AER),我们的方法可以优于基线技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号