首页> 中国专利> 一种多说话人、多语言的语音合成方法及系统

一种多说话人、多语言的语音合成方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种多说话人、多语言的语音合成方法，包括提取语音声学特征；将不同语言的文本处理为统一的表征方式，并将音频和文本对齐，获取时长信息；构建说话人空间和语言空间，生成说话人id和语言id，提取说话人向量和语言向量加入到初始语音合成模型，采用对齐后的文本、时长信息和语音声学特征对初始语音合成模型进行训练，得到语音合成模型；对待合成文本处理后生成说话人id和语言id；将说话人id、文本以及语言id，输入到语音合成模型，输出语音声学特征并转换为音频。还公开了一种系统。本发明实现了对说话人的特征以及语言特征的“解纠缠”，并且只需要变换id就可以实现说话人或语言的转换。

著录项

公开/公告号CN112435650A

专利类型发明专利
公开/公告日2021-03-02

原文格式PDF
申请/专利权人四川长虹电器股份有限公司;
展开▼

申请/专利号CN202011256113.X
发明设计人朱海;王昆;周琳珉;刘书君;
展开▼

申请日2020-11-11
分类号G10L13/047(20130101);G10L13/04(20130101);G10L13/08(20130101);G10L25/24(20130101);
代理机构51213 四川省成都市天策商标专利事务所;
代理人张秀敏
地址 621000 四川省绵阳市高新区绵兴东路35号
入库时间 2023-06-19 10:03:37

法律信息

法律状态公告日

法律状态信息

法律状态
2022-04-15

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种多说话人、多语言的语音合成方法及系统 [P] . 中国专利： CN112435650A . 2021-03-02
2. 一种基于变分自编码器的多说话人语音合成方法 [P] . 中国专利： CN112289304A . 2021-01-29
3. Synthesis method and computer realization device for converting arbitrary speaker voice into other speaker's intonation [P] . 韩国专利： KR960038733A . 1996-11-21

机译：一种将任意说话者语音转换成其他说话者语调的合成方法及计算机实现装置
4. METHOD OF TRAINING A ROBUST SPEAKER-DEPENDENT SPEECH RECOGNITION SYSTEM WITH SPEAKER-DEPENDENT EXPRESSIONS AND ROBUST SPEAKER-DEPENDENT SPEECH RECOGNITION SYSTEM [P] . 世界知识产权组织专利： WO2006033044A3 . 2006-05-04

机译：依赖于说话人的表达和依赖于说话人的语音的鲁棒说话人识别系统的训练方法
5. METHOD OF TRAINING A ROBUST SPEAKER-DEPENDENT SPEECH RECOGNITION SYSTEM WITH SPEAKER-DEPENDENT EXPRESSIONS AND ROBUST SPEAKER-DEPENDENT SPEECH RECOGNITION SYSTEM [P] . 世界知识产权组织专利： WO2006033044A2 . 2006-03-30

机译：依赖于说话人的表达和依赖于说话人的语音的鲁棒说话人识别系统的训练方法