首页> 中国专利> 一种多语言语音合成模型的训练方法及装置

一种多语言语音合成模型的训练方法及装置

页面导航

摘要
著录项
相似文献

摘要

本说明书实施例提供一种多语言语音合成模型的训练方法及装置，方法包括：基于各样本语言的样本音频的梅尔谱特征标签、样本音素序列、说话人标识标签，分别训练风格编码器、文本编码器以及解码器，以获得可以将音频的音色(通过说话人标识表征)、风格以及文本内容解耦开的风格编码器、文本编码器以及解码器，进而利用样本音频的说话人标识标签及样本音素序列，以及已训练的风格编码器输出的该样本音频的风格向量作为标签，训练风格预测器，以得到多语言语音合成模型。

著录项

公开/公告号CN113707125A

专利类型发明专利
公开/公告日2021-11-26

原文格式PDF
申请/专利权人中国科学院声学研究所;
展开▼

申请/专利号CN202111008489.3
发明设计人张鹏远;尚增强;颜永红;
展开▼

申请日2021-08-30
分类号G10L13/02(20130101);G10L13/08(20130101);G10L25/27(20130101);G10L25/03(20130101);
代理机构11309 北京亿腾知识产权代理事务所(普通合伙);
代理人陈霁
地址 100190 北京市海淀区北四环西路21号
入库时间 2023-06-19 13:24:42

相似文献

专利
中文文献
外文文献

1. 一种多语言语音合成模型的训练方法及装置 [P] . 中国专利： CN113707125A . 2021-11-26
2. 一种语音合成模型的训练方法、语音合成的方法及装置 [P] . 中国专利： CN113393828A . 2021-09-14
3. SPEECH SYNTHESIS DEVICE, SPEECH SYNTHESIS METHOD, SPEECH SYNTHESIS MODEL TRAINING DEVICE, SPEECH SYNTHESIS MODEL TRAINING METHOD, AND COMPUTER PROGRAM PRODUCT [P] . 美国专利： US2018174570A1 . 2018-06-21

机译：语音合成装置，语音合成方法，语音合成模型训练装置，语音合成模型训练方法以及计算机程序产品
4. METHOD, APPARATUS FOR SYNTHESIZING SPEECH AND ACOUSTIC MODEL TRAINING METHOD FOR SPEECH SYNTHESIS [P] . 美国专利： US2012221339A1 . 2012-08-30

机译：语音合成方法，装置及语音合成声学模型训练方法
5. MULTILINGUAL SPEECH RECOGNITION MODEL TRAINING METHOD, APPARATUS, DEVICE, AND STORAGE MEDIUM [P] . WO2021135438A1 . 2021-07-08

机译：多语言语音识别模型训练方法，装置，装置和存储介质