首页> 外文OA文献 >Minimum cut model for spoken lecture segmentation
【2h】

Minimum cut model for spoken lecture segmentation

机译:口语讲课细分的最小剪辑模型

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

We introduce a novel unsupervised algorithm for text segmentation. We re-conceptualize text segmentation as a graph-partitioning task aiming to optimize the normalized-cut criterion. Central to this framework is a contrastive analysis of lexical distribution that simultaneously optimizes the total similarity within each segment and dissimilarity across segments. Our experimental results show that the normalized-cut algorithm obtains performance improvements over the state-of-the-art techniques on the task of spoken lecture segmentation. Another attractive property of the algorithm is robustness to noise. The accuracy of our algorithm does not deteriorate significantly when applied to automatically recognized speech. The impact of the novel segmentation framework extends beyond the text segmentation domain. We demonstrate the power of the model by applying it to the segmentation of raw acoustic signal without intermediate speech recognition.
机译:我们介绍了一种新颖的无监督文本分割算法。我们将概念上的文本分割重新概念化为图形分割任务,旨在优化归一化剪切标准。该框架的核心是对词汇分布的对比分析,该分析可同时优化每个段内的总体相似度和跨段间的相似度。我们的实验结果表明,归一化剪切算法在口头演讲分割任务上的性能优于最新技术。该算法的另一个吸引人的特性是对噪声的鲁棒性。当将算法应用于自动识别的语音时,其准确性不会显着降低。新颖的分割框架的影响超出了文本分割领域。我们通过将模型应用于未经中间语音识别的原始声学信号分割来证明该模型的功能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号