一种基于改进注意力机制的实时鲁棒语音合成方法

唐君; 张连海; 李嘉欣

首页> 中文期刊>信号处理 >一种基于改进注意力机制的实时鲁棒语音合成方法

一种基于改进注意力机制的实时鲁棒语音合成方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,以减少一些错误发音问题;2.引入一种注意力损失来指导注意力模型的学习,以实现其快速、准确的学习能力;3.采用WaveGlow模型作为声码器,以加快语音生成的速度。在LJSpeech数据集上的实验表明,改进后的网络提高了注意力学习的速度和精度,合成语音的错误率相比基线降低了33.4%;同时,整个网络合成语音的速度相比之下提升约523倍,实时因子(Real Time Factor,RTF)为0.96,满足实时性的要求;此外,在语音质量方面,合成语音的平均主观意见分(Mean Opinion Score,MOS)达到3.88。

著录项

来源
《信号处理》|2022年第3期|527-535|共9页
作者
唐君; 张连海; 李嘉欣;
展开▼
作者单位

中国人民解放军战略支援部队信息工程大学信息系统工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音合成;
关键词
语音合成; 注意力损失机制; Tacotron 2; WaveGlow; 序列到序列;
入库时间 2022-09-15 21:35:28

相似文献

中文文献
外文文献
专利

1. 一种基于孪生网络的高鲁棒性实时单目标船舶跟踪方法 [J] . 张云飞 ,黄润辉 ,单云霄 . 舰船科学技术 . 2019,第012期
2. 复杂环境下一种基于改进核相关滤波的视觉鲁棒目标跟踪方法 [J] . 何容 ,赖际舟 ,吕品 . 导航定位与授时 . 2020,第006期
3. 一种鲁棒的人脸关键点实时跟踪方法 [J] . 徐威威 ,李俊 . 计算机工程 . 2018,第004期
4. 一种运动目标检测实时性和鲁棒性的方法 [J] . 池利阳 ,李民政 ,吴新强 . 计算机应用与软件 . 2015,第002期
5. 一种实时鲁棒的超分辨率图像重建方法 [J] . 刘润丹 ,潘新生 . 计算机工程与应用 . 2012,第009期
6. 一种改进的基于鲁棒估计的动态数据校正方法 [C] . 姜春阳 ,邱彤 ,陈丙珍 . 第11届中国化工学会信息技术应用专业委员会年会 . 2007
7. 基于注意力机制的中文文本分类方法及鲁棒性研究 [A] . 王从超 . 2021

一种基于改进注意力机制的实时鲁棒语音合成方法

摘要

著录项

相似文献

相关主题

期刊订阅