基于迁移学习的自适应语音合成

孙志宏; 叶焱; 刘太君; 许高明

首页> 中文期刊> 《数据通信》 >基于迁移学习的自适应语音合成

基于迁移学习的自适应语音合成

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为利用少量目标语料来建立自适应的语音合成系统,提出了基于迁移学习的自适应语音合成方法.本文首先在多说话人语料数据集中,用一个256维讲者嵌入(Speaker Embedding)在模型中表征不同的说话人,然后在Fastspeech2声学模型的基础上进行改进作为声学特征提取器:尝试用参考编码器(Reference Encoder)将语音中的说话人风格进行"解耦合",以更加精确地提取到说话人的音色特征,进而训练出一个多说话人的预训练模型.在获取目标说话人少量语音(十几句话)的情况下,通过微调(Fine-tune)神经网络参数就可获得良好的自适应合成效果.最后,在目标说话人原音频和自适应生成的语音通过映射成空间向量进行对比,实验结果平均可达70％以上的相似度.

著录项

来源
《数据通信》 |2021年第5期|47-51|共5页
作者
孙志宏; 叶焱; 刘太君; 许高明;
展开▼
作者单位

宁波大学信息科学与工程学院宁波315211;

宁波大学信息科学与工程学院宁波315211;

宁波大学信息科学与工程学院宁波315211;

宁波大学信息科学与工程学院宁波315211;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
迁移学习; 自适应; 语音合成; 讲者嵌入; 参考编码器;

相似文献

中文文献
外文文献
专利

1. 基于语音参数自适应的缅甸语情感语音合成 [J] . 刘奇云 ,杨鉴 ,谭婉琳 . 计算机科学与应用 . 2022,第1期
2. 基于多情感说话人自适应的情感语音合成研究 [J] . 李葵 ,徐海青 ,吴立刚 . 湘潭大学自然科学学报 . 2018,第004期
3. 利用说话人自适应实现基于DNN的情感语音合成 [J] . 智鹏鹏 ,杨鸿武 ,宋南 . 重庆邮电大学学报（自然科学版） . 2018,第005期
4. 基于多情感说话人自适应的情感语音合成研究 [J] . 李葵12 ,徐海青3 ,吴立刚3 . 湘潭大学学报：自然科学版 . 2018,第004期
5. 基于最大后验概率的语音合成说话人自适应 [J] . 赵欢欢 ,凌震华 ,王仁华 . 数据采集与处理 . 2010,第004期
6. 基于自适应训练的疑问句语音合成 [C] . FANG Shuo ,方硕 ,WEN Zhengqi . 第十三届全国人机语音通讯学术会议 . 2015
7. 基于自适应实例归一化的多说话人语音合成模型 [A] . 徐珊 . 2020

基于迁移学习的自适应语音合成

摘要

著录项

相似文献

相关主题

期刊订阅