首页> 中国专利> 一种多说话人、多语言的语音合成方法及系统

一种多说话人、多语言的语音合成方法及系统

摘要

本发明公开了一种多说话人、多语言的语音合成方法,包括提取语音声学特征;将不同语言的文本处理为统一的表征方式,并将音频和文本对齐,获取时长信息;构建说话人空间和语言空间,生成说话人id和语言id,提取说话人向量和语言向量加入到初始语音合成模型,采用对齐后的文本、时长信息和语音声学特征对初始语音合成模型进行训练,得到语音合成模型;对待合成文本处理后生成说话人id和语言id;将说话人id、文本以及语言id,输入到语音合成模型,输出语音声学特征并转换为音频。还公开了一种系统。本发明实现了对说话人的特征以及语言特征的“解纠缠”,并且只需要变换id就可以实现说话人或语言的转换。

著录项

  • 公开/公告号CN112435650A

    专利类型发明专利

  • 公开/公告日2021-03-02

    原文格式PDF

  • 申请/专利权人 四川长虹电器股份有限公司;

    申请/专利号CN202011256113.X

  • 发明设计人 朱海;王昆;周琳珉;刘书君;

    申请日2020-11-11

  • 分类号G10L13/047(20130101);G10L13/04(20130101);G10L13/08(20130101);G10L25/24(20130101);

  • 代理机构51213 四川省成都市天策商标专利事务所;

  • 代理人张秀敏

  • 地址 621000 四川省绵阳市高新区绵兴东路35号

  • 入库时间 2023-06-19 10:03:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-15

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号