首页> 外文会议>日本音響学会;日本音響学会研究発表会 >楽譜時間情報を用いたアテンション機構に基づく歌声合成の検討
【24h】

楽譜時間情報を用いたアテンション機構に基づく歌声合成の検討

机译:基于得分时间信息的基于注意力机制的歌唱语音合成考试

获取原文

摘要

歌声合成の手法として,深層構造を持つニューラルネットワーク(Deep Neural Network; DNN) に基づく歌声合成が挙られる.このシステムは,音響モデル,発声タイミングモデル,音素継続長モデルから構成される.学習の際はそれぞれのモデルに対し独立した最適化を行うが,より高品質な歌声を合成するためには,システム全体として最適化可能なモデルが必要と考えられる.一方近年では,Tacotron 2などの,アテンション機構を含むsequence-to-sequenceモデルにより音響特徴量と時間構造を同時にモデル化する手法が提案されている.そこで本研究では,アテンション機構に基づく歌声合成を提案し,その有効性を検証する.
机译:具有深层结构的神经作为唱歌声音合成的一种方法 基于网络(深度神经网络; DNN) 可以提及唱歌语音合成。该系统是音频系统 从戴尔,发声计时模型,音素延续长度模型 它是组成的。学习时每个模型独立 优化但合成的更高品质的歌声 为此,可以针对整个系统进行优化的模型 认为是必要的。另一方面,近年来Tacotron 2 其中,序列到序列包括注意机制 通过模型同时建立声学特征和时间结构模型 已经提出了一种方法。因此,在这项研究中 基于张力机制的拟议歌声合成及其效果 验证性别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号