首页> 中文会议>第十二届全国人机语言通讯学术会议(NCMMSC`2013) >高准确度无标注的句子切分算法的研究

高准确度无标注的句子切分算法的研究

摘要

高准确度,无标注的句子自动切分方法是快速构建大型语音语料库技术的核心.本文提出了一种将基于隐马尔科夫模型(HMM)的强制对齐技术(Force-alignment)和半监督学习的方法(Co_training)相融合的新的句子自动切分算法.该算法能够将篇幅语音依照对应的文本切分为独立的句子,而又不失原有的韵律特征信息.实验表明:利用该算法来构建语音语料库,句子的切分准确率能够达到96.2%,同时合成语音的表现力和自然度都会有一定程度上的提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号