首页> 中国专利> 一种韵律控制语音合成方法、系统及电子装置

一种韵律控制语音合成方法、系统及电子装置

摘要

本申请涉及一种韵律控制语音合成方法、系统和电子装置,其中所述方法包括:对待合成文本进行正则获取语言学特征和音素序列;将所述音素序列输入Tacotron2模型的编码器;将编码结果和所述语言学特征输入韵律参数预测模型,预测待合成文本的韵律参数,获得音素级别的时长和DCT参数化基频;将所述音素级别时长和DCT参数化基频映射为二维向量,与所述编码结果拼接输入Tacotron2的解码器,输出韵律声学特征序列;将所述韵律声学特征序列送入声码器合成语音信号。该方法通过使用DCT参数化的基频和时长,使得Tacotron2模型中能够引入额外的语言学特征来辅助韵律的控制,并且该方法使得模型能够收敛,更加具有解释性。该方法相比其他方法更加鲁棒,对于长句更加稳定。

著录项

  • 公开/公告号CN111754976A

    专利类型发明专利

  • 公开/公告日2020-10-09

    原文格式PDF

  • 申请/专利号CN202010705955.2

  • 发明设计人 张鹏远;尚增强;颜永红;

    申请日2020-07-21

  • 分类号G10L13/02(20130101);G10L13/04(20130101);G10L13/10(20130101);

  • 代理机构11309 北京亿腾知识产权代理事务所(普通合伙);

  • 代理人陈霁

  • 地址 100190 北京市海淀区北四环西路21号

  • 入库时间 2023-06-19 08:31:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-07

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号