首页> 中国专利> 一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法

一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及语音合成，语音转换领域，更具体地，涉及一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法。本发明用多说话人的语音合成技术生成大量的平行预料，这为模型的训练提供了极大的方便。然后使用序列到序列的神经网络对输入的源说话人特征建模映射到目标说话人特征。为了实现多对多的语音转换，本发明使用说话人验证任务的模型产生表征说话人身份的声纹特征向量。源说话人和目标说话人的声纹特征向量作为辅助信心加入序列到序列的模型中去。经过模型训练测试，本发明能够取得不错的效果。

著录项

公开/公告号CN112071325A

专利类型发明专利
公开/公告日2020-12-11

原文格式PDF
申请/专利权人中山大学;
展开▼

申请/专利号CN202010922366.X
发明设计人杨耀根;张东;
展开▼

申请日2020-09-04
分类号G10L21/003(20130101);G10L21/007(20130101);G10L17/02(20130101);G10L15/02(20060101);G10L15/16(20060101);G10L25/18(20130101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人王晓玲
地址 510275 广东省广州市海珠区新港西路135号
入库时间 2023-06-19 08:06:35

法律信息

法律状态公告日

法律状态信息

法律状态
2023-09-05

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法 [P] . 中国专利： CN112071325A . 2020-12-11
2. 一种由唇部图像序列到语音编码参数的转换方法 [P] . 中国专利： CN108648745B . 2020.09.01
3. METHOD FOR GENERATING KOREAN SPEECH SYNTHESIZER MODEL BASED ON SEQUENCE-TO-SEQUENCE DEEP CONVOLUTIONAL NEURAL NETWORK AI [P] . 韩国专利： KR20200075064A . 2020-06-26

机译：基于序列到序列深层卷积神经网络AI的韩国语音合成器模型的生成方法
4. Device and method of modeling acoustic characteristics with HMM and collating the same with a voice characteristic vector sequence [P] . 美国专利： US7895040B2 . 2011-02-22

机译：用HMM建模声学特征并将其与语音特征向量序列进行核对的装置和方法
5. SPATIAL AND TEMPORAL SEQUENCE-TO-SEQUENCE MODELING FOR HANDWRITING RECOGNITION [P] . US2021216760A1 . 2021-07-15

机译：手写识别的空间和时间序列到序列建模