首页> 外文会议>日本音響学会研究発表会 >End-to-End 型テキスト音声合成におけるWaveNet ボコーダの学習に関する調査
【24h】

End-to-End 型テキスト音声合成におけるWaveNet ボコーダの学習に関する調査

机译:语音合成中的Wavenet Vocoder学习的端到端文本调查

获取原文

摘要

本研究では,合成音声の品質に寄与する要因を明らかにすることを目的とし,Tacotron 2 におけるWaveNet ボコーダの学習に関する調査を行った.実験的評価により,単なるファインチューニングの適用では自然性の改善が見られないが,音響特徴量系列に対する時間方向の畳み込み層の適用で自然性が改善することが分かった.また,ファインチューニングと畳み込み層を併用することで,さらなる自然性の改善が見込めることを確認した.今後の課題として,Tacotron 2 の合成時における推定音響特徴量を用いたファインチューニングの検討が挙げられる.
机译:在这项研究中,有助于合成语音质量的因素在塔克罗伦2的目的我们对Wavenet Vocoder学习进行了调查。水果实验评价简单地调整的应用没有看到自然的性质改善,但声学特征数量在时间方向上的应用,卷积层的应用改变了自然特性事实证明是好的。另外,微调通过组合卷积层的进一步自然确认可以预期改进。作为未来的问题,在合成塔歇尔斯腾腾2时使用估计声学特征检查微调有。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号