首页> 中国专利> 一种双层自回归解码的序列到序列语音合成方法及系统

一种双层自回归解码的序列到序列语音合成方法及系统

摘要

本发明提出一种双层自回归解码的序列到序列语音合成方法及系统,系统包括编码器和解码器,所述解码器包括:音素级表征模块、音素级预测模块、帧级预测模块;所述编码器将音素名、音调和韵律短语边界信息用向量表征,然后使用卷积神经网络和双向长短时记忆网络将这些信息编码融合得到句子中每个音素的上下文单元表征;所述音素级表征模块,通过帧一级的长短时记忆网络(LSTM)和池化处理获得每个音素单元的声学单元表征;所述音素级预测模块,采用音素级自回归结构来预测当前音素的声学单元表征并建立连续音素之间的依赖关系;所述帧级预测模块,通过解码器LSTM来预测帧级的声学特征。

著录项

  • 公开/公告号CN111883102A

    专利类型发明专利

  • 公开/公告日2020-11-03

    原文格式PDF

  • 申请/专利权人 中国科学技术大学;

    申请/专利号CN202010672991.3

  • 发明设计人 周骁;凌震华;戴礼荣;

    申请日2020-07-14

  • 分类号G10L13/047(20130101);G10L13/04(20130101);G10L13/08(20130101);G10L25/30(20130101);G10L25/24(20130101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11251 北京科迪生专利代理有限责任公司;

  • 代理人张乾桢

  • 地址 230026 安徽省合肥市包河区金寨路96号

  • 入库时间 2023-06-19 08:47:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-30

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号