首页> 中文期刊> 《清华大学学报:自然科学版》 >汉语语音合成中说话人自适应的时长优化

汉语语音合成中说话人自适应的时长优化

         

摘要

在汉语语音合成中,音节内清音和浊音的时长是影响自然度的重要因素、并且与说话人关系较大的个性化特征之一。该文针对基于隐Markov模型(HMM)的汉语语音合成说话人自适应,提出了一种清浊音时长优化算法。将原始说话人训练语料的清音在音节中的相对时长特征根据语境特征进行决策树聚类,并进一步使用自适应算法将决策树中的特征值自适应到目标说话人的清音相对时长。在语音合成时,从该决策树得到目标说话人的清音相对时长参考值,合成语音的清浊音时长按照参考值进行调整。实验表明:该算法可以提高HMM汉语语音合成中说话人自适应的时长预测准确度,有效地提高说话人自适应的相似度和合成语音的自然度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号