【24h】

Arabic Speech Synthesis using Deep Neural Networks

机译:使用深神经网络的阿拉伯语语音合成

获取原文

摘要

Text-to-speech (TTS) synthesis is a rapidly growing field of research. Deep learning has shown impressive results in speech synthesis and outperformed the older concatenative and parametric methods. In this paper, speech synthesis using deep learning architectures is explored and two models are utilized in an end-to-end Arabic TTS system. The results of the two systems are compared to concatenative TTS system using the Mean Opinion Score (MOS) of the synthesized speech and indicates that deep learning based systems have outperformed the concatenative system when it comes to naturalness and intelligibility; moreover, it reduces system complexity.
机译:文本到语音(TTS)合成是一种快速增长的研究领域。深入学习表明令人印象深刻的语音合成和优于较旧的连接和参数方法。在本文中,探索了使用深度学习架构的语音合成,并且在端到端阿拉伯语TTS系统中使用了两种型号。使用合成语音的平均意见分数(MOS)的均衡TTS系统将两种系统的结果与合成语音的平均意见分数进行比较,并表示基于深度的基于学习的系统在自然和可懂度方面表现优于连接系统;此外,它降低了系统复杂性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号