【24h】

Towards automatic phonetic segmentation for TTS

机译:面向TTS的自动语音分割

获取原文

摘要

Phonetic segmentation is an important step in the development of a concatenative TTS voice. This paper introduces a segmentation process consisting of two phases. First, forced alignment is performed using an HMM-GMM model. The resulting segmentation is then locally refined using an SVM based boundary model. Both the models are derived from multi-speaker data using a speaker adaptive training procedure. Evaluation results are obtained on the TIMIT corpus and on a proprietary single-speaker TTS corpus.
机译:语音分割是发展级联TTS语音的重要步骤。本文介绍了由两个阶段组成的细分过程。首先,使用HMM-GMM模型执行强制对齐。然后使用基于SVM的边界模型对所得分割进行局部优化。这两个模型都是使用说话者自适应训练程序从多说话者数据中得出的。评估结果是从TIMIT语料库和专有的单扬声器TTS语料库获得的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号