首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >音声生成過程を考慮したWaveNetに基づく音声波形合成法
【24h】

音声生成過程を考慮したWaveNetに基づく音声波形合成法

机译:基于Wavenet考虑语音生成过程的语音波形综合方法

获取原文
获取原文并翻译 | 示例
           

摘要

我々は最近新たに提案されたニューラルネットワークであるWaveNetを援用することで,既存のソースフィルタモデルに課された種々の制約を解消する,音声波形を直接モデル化可能な新たなボコーダの実現を目指す.本研究では,ボコーダの音響パラメータをWaveNetの入力補助特徴量に用い,音声波形を合成する手法を提案する.これらパラメータは音声の生成過程を考慮して抽出されることから,補助特徴量として効果的に働くことが期待される.実験ではメルケプストラムボコーダのパラメータを対象とし,合成音声の品質をSNR(Signal-to-Noise Ratio)とSDR(Signal-to-Distortion Ratio)の2つの指標によって客観的に評価した.実験の結果,SNRについて有意な改善を得たことから,提案法の有効性が確認された.
机译:我们的目标是实现一种可以直接模型音频波形的新声码器,这消除了对现有源滤波器模型的各种约束,最近提出了新提出的神经网络。 在本研究中,我们提出了一种使用Vocoder输入辅助特征数量的声码器声学参数的方法并合成语音波形。 由于考虑到语音的生成过程来提取这些参数,因此预计将有效地作为辅助特征工作。 在实验中,MercepStrum Vocoder的质量是针对性的,并且通过SNR(信噪比比)和SDR(信号 - 失真率)的两个指示器客观地评估合成语音的质量。 由于实验结果,已经证实了对SNR的显着改善,确认了所提出的方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号