首页> 中国专利> 一种细粒度韵律建模的语音生成模型、设备及存储介质

一种细粒度韵律建模的语音生成模型、设备及存储介质

摘要

本发明提供细粒度韵律建模的语音生成模型、设备及存储介质,其中,模型包括:文本信息输入文本编码器模块,得到文本的编码特征;频谱信息输入韵律编码模块,得到音素级别的语音的韵律特征;语音的韵律特征输入解耦合模块,将语音的韵律特征中包含的文本内容信息和韵律信息解耦合,并只留下语音的韵律特征的韵律信息;文本的编码特征和语音的韵律特征的韵律信息输入解码器,生成合成语音。本发明提出的方案能够利用时长信息对音频进行时域的划分,韵律编码器可以建模语音的局部韵律信息以描述韵律的变化走势,同时韵律解耦合模块保证了韵律编码器模型只学习到语音的韵律信息而不包含文本信息。

著录项

  • 公开/公告号CN114093342A

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 中国科学院自动化研究所;

    申请/专利号CN202210078586.8

  • 发明设计人 陶建华;王诗明;傅睿博;易江燕;

    申请日2022-01-24

  • 分类号G10L13/10(20130101);G10L13/02(20130101);

  • 代理机构11662 北京华夏泰和知识产权代理有限公司;

  • 代理人邓菊香

  • 地址 100190 北京市海淀区中关村东路95号

  • 入库时间 2023-06-19 14:15:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    实质审查的生效 IPC(主分类):G10L13/10 专利申请号:2022100785868 申请日:20220124

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号