首页> 中文会议>第十四届全国人机语音通讯学术会议 >基于深度卷积神经网络的语音参数合成器

基于深度卷积神经网络的语音参数合成器

摘要

本文提出了一种基于深度卷积神经网络的语音参数合成器,用以实现从倒谱、基频等语音声学特征中重构语音波形信号.该合成器基于WaveNet模型进行构建,使用深度扩张因果卷积神经网络对每个采样点波形幅度的条件概率分布进行建模,其条件包括了历史波形信息以及当前采样点对应的输入声学特征.在训练阶段,使用特定说话人的语音数据库进行模型参数的估计.在合成阶段,基于每个采样点的条件概率分布进行语音波形的逐点采样生成.实验结果表明,在输入自然声学参数以及由统计参数语音合成系统预测的声学参数情况下,该参数合成器均能够取得优于STRAIGHT合成器的生成语音质量.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号