首页> 中国专利> 一种语音合成模型训练方法、音频生成方法、设备及介质

一种语音合成模型训练方法、音频生成方法、设备及介质

页面导航

摘要
著录项
相似文献

摘要

本申请公开了一种语音合成模型训练方法、音频生成方法、设备及介质，包括：获取训练样本集；输入至语音合成模型；提取文本样本的文字内容特征向量、表述方式特征向量；提取语音样本的语音特征向量以及确定对应的风格向量；基于风格向量、文字内容特征向量、表述方式特征向量确定文本样本的预测梅尔频谱；利用预测梅尔频谱和语音样本的真实梅尔频谱确定梅尔频谱损失，利用风格向量和标签信息确定风格向量损失；基于所述梅尔频谱损失以及所述风格向量损失确定综合训练损失，当所述综合训练损失收敛，得到训练后语音合成模型和训练后风格向量。能够提升训练得到的语音合成模型对不同表述方式的区分效果，从而提升合成语音的自然度，以及用户体验。

著录项

公开/公告号CN113658577A

专利类型发明专利
公开/公告日2021-11-16

原文格式PDF
申请/专利权人腾讯音乐娱乐科技(深圳)有限公司;
展开▼

申请/专利号CN202110937782.1
发明设计人徐东;陈洲旋;
展开▼

申请日2021-08-16
分类号G10L13/02(20130101);G10L13/04(20130101);G10L13/08(20130101);
代理机构44285 深圳市深佳知识产权代理事务所(普通合伙);
代理人陈彦如
地址 518052 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)
入库时间 2023-06-19 13:16:59

相似文献

专利
中文文献
外文文献

1. 一种语音合成模型训练方法、音频生成方法、设备及介质 [P] . 中国专利： CN113658577A . 2021-11-16
2. 一种语音合成模型训练方法、装置、电子设备及存储介质 [P] . 中国专利： CN110136691B . 2021.09.28
3. VOICE SYNTHESIS MODEL GENERATION DEVICE, VOICE SYNTHESIS MODEL GENERATION SYSTEM, COMMUNICATION TERMINAL DEVICE AND METHOD FOR GENERATING VOICE SYNTHESIS MODEL [P] . 欧洲知识产权局专利： EP2306450A4 . 2012-09-05

机译：语音合成模型生成装置，语音合成模型生成系统，通信终端设备以及生成语音合成模型的方法
4. VOICE SYNTHESIS MODEL GENERATION DEVICE, VOICE SYNTHESIS MODEL GENERATION SYSTEM, COMMUNICATION TERMINAL DEVICE AND METHOD FOR GENERATING VOICE SYNTHESIS MODEL [P] . 韩国专利： KR20110021944A . 2011-03-04

机译：语音合成模型生成装置，语音合成模型生成系统，通信终端设备以及生成语音合成模型的方法
5. VOICE SYNTHESIS MODEL GENERATION DEVICE, VOICE SYNTHESIS MODEL GENERATION SYSTEM, COMMUNICATION TERMINAL DEVICE AND METHOD FOR GENERATING VOICE SYNTHESIS MODEL [P] . 欧洲知识产权局专利： EP2306450A1 . 2011-04-06

机译：语音合成模型生成装置，语音合成模型生成系统，通信终端设备以及生成语音合成模型的方法