首页> 中文期刊> 《计算机工程》 >面向语音转换的汉语语料自动选取算法

面向语音转换的汉语语料自动选取算法

         

摘要

In order to realize voice conversion, a satisfied voice conversion corpus needs to be built up.This paper proposes an automatic corpus selection algorithm based on the semi-syllable model.Because the number of corpus sentences is small for voice conversion, the semi-syllable is chosen as the basic unit of the corpus.The algorithm automatically selects corpus from original corpus.An evaluation function is utilized to score sentences from original corpus according to the number and the kind of semi-syllable.When the number of chosen sentences is 615, the set of selected text covers 97.8% of the semi-syllables.The covering rate, coverage efficiency and sparse rate are obviously better than that of conventional algorithms.%为实现语音转换,建立符合要求的汉语语音转换语料库,提出一种基于半音节模型的语料自动选取算法.根据语音转换训练时需要语料数量较少的特征,选择半音节作为语料库的基本单位.在此基础上,从原始语料中自动选取语料,根据语音转换对说话人特征较敏感的情况,利用评估函数并根据半音节的出现次数对原始语料中的句子进行打分.实验结果表明,与传统算法相比,该算法在语音库自动选取615句汉语语料时,可以覆盖97.8%的带声调半音节,其覆盖效率、覆盖率和稀疏度有较大改进.

著录项

  • 来源
    《计算机工程》 |2011年第5期|256-257260|共3页
  • 作者单位

    国防科学技术大学电子科学与工程学院;

    长沙;

    410073;

    国防科学技术大学电子科学与工程学院;

    长沙;

    410073;

    国防科学技术大学电子科学与工程学院;

    长沙;

    410073;

    国防科学技术大学电子科学与工程学院;

    长沙;

    410073;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP311.52;
  • 关键词

    中文信息处理; 语音库; 语音转换; 覆盖率;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号