...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >話者コードを用いたDNN音声合成における話者適応手法の検討
【24h】

話者コードを用いたDNN音声合成における話者適応手法の検討

机译:用扬声器代码检查DNN语音合成中扬声器适应方法

获取原文
获取原文并翻译 | 示例
           

摘要

本論文では,DNNに基づくテキスト音声合成の話者適応手法にづいて,従来提案されている手法間の性能を比較するため,客観評価実験を行う.1つの話者適応手法は,話者コードを中間層に入力することで,話者の特徴をモデル化する手法である.目標話者の話者コードを再推定するモデル適応手法の他に,話者コードから中間層への回帰関数を再推定する適応手法を我々は過去に提案している.もう1つの話者適応手法は,話者依存出力層を用いた手法であり,DNNの全中間層を話者間で共有し,話者ごとに異なる出力層を持つDNNを使用する.話者適応時には,目標話者に対応する出力層の回帰パラメータが再推定される.これらの話者適応手法はこれまで同一実験条件下で比較されておらず,モデル構造や適応時に再推定されるパラメータ数等の差異が,どのように性能に影響するかは明らかでない.本研究は,35名の話者からなる音声コーパスを使用した話者適応実験を行い,客観評価により各話者適応手法の性能を比較した.実験結果から,話者コードに基づく手法では,適応パラメータ数が大きいモデルの性能が高い傾向が確認された.また,話者コードに基づく手法は,適応パラメータ数が十分大きい場合,話者依存出力層を用いた手法と性能が同程度であることが明らかとなった.
机译:在本文中,我们进行客观评估实验,以基于基于DNN的文本语音合成的扬声器适应方法来比较所提出的方法的性能。一种扬声器适配方法是通过将扬声器代码输入到中间层来建立扬声器特性的方法。除了恢复目标讲话者的扬声器代码的模型适配方法之外,我们提出了一种从扬声器代码到过去到中间层的回归函数的方法。另一个扬声器适配方法是使用扬声器相关输出层的技术,共享扬声器中的所有中间层,并为每个扬声器使用具有不同输出层的DNN。在扬声器适应时,重新估计对应于目标讲话者的输出层的回归参数。这些扬声器适应技术在相同的实验条件下尚未进行比较,并且尚不清楚在模型结构和适应时重新采样的参数数量之间的差异影响性能。本研究通过由35个扬声器组成的语音语料库进行了演讲者自适应实验,并通过客观评估进行了每个扬声器适应方法的性能。从实验结果,在基于扬声器代码的技术中,具有大适应参数的模型的性能得到了高性能趋势。此外,当基于扬声器代码的方法具有足够大的适应参数时,已经清楚地清楚使用扬声器相关输出层的方法和性能具有相同的级别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号