首页> 外文OA文献 >Unsupervised Speaker Change Detection for Broadcast News Segmentation
【2h】

Unsupervised Speaker Change Detection for Broadcast News Segmentation

机译:用于广播新闻分段的无监督扬声器变化检测

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper presents a speaker change detection system for news broadcast segmentation based on a vector quantization (VQ) approach. The system does not make any assumption about the number of speakers or speaker identity. The system uses mel frequency cepstral coefficients and change detection is done using the VQ distortion measure and is evaluated against two other statistics, namely the symmetric Kullback-Leibler (KL2) distance and the so-called ‘divergence shape distance'. First level alarms are further tested using the VQ distortion. We find that the false alarm rate can be reduced without significant losses in the detection of correct changes. We furthermore evaluate the generalizability of the approach by testing the complete system on an independent set of broadcasts, including a channel not present in the training set.
机译:本文提出了一种基于矢量量化(VQ)方法的新闻广播分段说话人变化检测系统。系统不对说话者的数量或说话者身份做任何假设。该系统使用梅尔频率倒谱系数,并使用VQ失真度量进行变化检测,并根据其他两个统计数据进行评估,即对称Kullback-Leibler(KL2)距离和所谓的“散度形状距离”。使用VQ失真进一步测试第一级警报。我们发现,在检测正确更改方面,可以降低虚警率,而不会造成重大损失。此外,我们通过在一组独立的广播(包括训练集中不存在的频道)上测试整个系统,来评估该方法的通用性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号