首页> 外文会议>映像情報メディア学会2018年冬季大会講演予稿集 >日本語end-to-end音声合成における発話スタイル制御に関する検討
【24h】

日本語end-to-end音声合成における発話スタイル制御に関する検討

机译:日语端到端语音合成中话语风格控制的研究

获取原文
获取原文并翻译 | 示例

摘要

番組制作の意図に沿った放送品質の音声合成を実現するためには、番組の演出要件に応じて発話スタイルを制御することが重要である。例えばニュース、スポーツ実況、ドキュメンタリーなど、番組によってそれぞれ異なる発話スタイルが求められる。そこで、Encoder-DecoderモデルのDNN(Deep Neural Network)を用いた日本語 end-to-end 音声合成において、これらの番組特有の発話スタイルを再現する方式を提案する。今回、提案手法で作成した合成音声について主観評価実験を実施し、その有効性を検証したので報告する。
机译:重要的是,根据节目的性能要求来控制发声风格,以便根据节目制作的目的来实现广播质量的语音合成。例如,每个节目需要不同的发声风格,例如新闻,体育评论和纪录片。因此,我们提出了一种使用Encoder-Decoder模型的DNN(深度神经网络)在日语端到端语音合成中重现这些程序特有的发声风格的方法。在本文中,我们对通过该方法创建的合成语音进行了主观评估实验,并验证了其有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号