首页> 中国专利> 一种细粒度韵律建模的语音生成模型、设备及存储介质

一种细粒度韵律建模的语音生成模型、设备及存储介质

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供细粒度韵律建模的语音生成模型、设备及存储介质，其中，模型包括：文本信息输入文本编码器模块，得到文本的编码特征；频谱信息输入韵律编码模块，得到音素级别的语音的韵律特征；语音的韵律特征输入解耦合模块，将语音的韵律特征中包含的文本内容信息和韵律信息解耦合，并只留下语音的韵律特征的韵律信息；文本的编码特征和语音的韵律特征的韵律信息输入解码器，生成合成语音。本发明提出的方案能够利用时长信息对音频进行时域的划分，韵律编码器可以建模语音的局部韵律信息以描述韵律的变化走势，同时韵律解耦合模块保证了韵律编码器模型只学习到语音的韵律信息而不包含文本信息。

著录项

公开/公告号CN114093342A

专利类型发明专利
公开/公告日2022-02-25

原文格式PDF
申请/专利权人中国科学院自动化研究所;
展开▼

申请/专利号CN202210078586.8
发明设计人陶建华;王诗明;傅睿博;易江燕;
展开▼

申请日2022-01-24
分类号G10L13/10(20130101);G10L13/02(20130101);
代理机构11662 北京华夏泰和知识产权代理有限公司;
代理人邓菊香
地址 100190 北京市海淀区中关村东路95号
入库时间 2023-06-19 14:15:58

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-15

实质审查的生效 IPC(主分类):G10L13/10 专利申请号:2022100785868 申请日:20220124

实质审查的生效

相似文献

专利
中文文献
外文文献

1. 一种细粒度韵律建模的语音生成模型、设备及存储介质 [P] . 中国专利： CN114093342A . 2022-02-25
2. 一种可控制韵律情感的语音合成方法、装置、存储介质 [P] . 中国专利： CN110299131B . 2021.12.10
3. Speaking-rate normalized prosodic parameter builder, speaking-rate dependent prosodic model builder, speaking-rate controlled prosodic-information generation device and prosodic-information generation method able to learn different languages and mimic various speakers' speaking styles [P] . 美国专利： US10192542B2 . 2019-01-29

机译：语音归一化韵律参数构建器，与语音速率有关的韵律模型构建器，语音速率受控的韵律信息生成设备和韵律信息生成方法，能够学习不同的语言并模仿各种说话者的说话风格
4. Prosody correction device, speech synthesis device, prosody correction method, speech synthesis method, prosody correction program, and speech synthesis program [P] . 日本专利： JP4841339B2 . 2011-12-21

机译：韵律校正设备，语音合成设备，韵律校正方法，语音合成方法，韵律校正程序和语音合成程序
5. Prosody control rule generation method, speech synthesis method, prosody control rule generation device, speech synthesis device, prosody control rule generation program, and speech synthesis program [P] . 日本专利： JP4559950B2 . 2010-10-13

机译：韵律控制规则生成方法，语音合成方法，韵律控制规则生成设备，语音合成设备，韵律控制规则生成程序和语音合成程序