首页> 中国专利> 一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法

一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法

摘要

本发明涉及语音合成,语音转换领域,更具体地,涉及一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法。本发明用多说话人的语音合成技术生成大量的平行预料,这为模型的训练提供了极大的方便。然后使用序列到序列的神经网络对输入的源说话人特征建模映射到目标说话人特征。为了实现多对多的语音转换,本发明使用说话人验证任务的模型产生表征说话人身份的声纹特征向量。源说话人和目标说话人的声纹特征向量作为辅助信心加入序列到序列的模型中去。经过模型训练测试,本发明能够取得不错的效果。

著录项

  • 公开/公告号CN112071325A

    专利类型发明专利

  • 公开/公告日2020-12-11

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN202010922366.X

  • 发明设计人 杨耀根;张东;

    申请日2020-09-04

  • 分类号G10L21/003(20130101);G10L21/007(20130101);G10L17/02(20130101);G10L15/02(20060101);G10L15/16(20060101);G10L25/18(20130101);

  • 代理机构44102 广州粤高专利商标代理有限公司;

  • 代理人王晓玲

  • 地址 510275 广东省广州市海珠区新港西路135号

  • 入库时间 2023-06-19 08:06:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-05

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号