首页> 外文会议>日本音響学会2019年春季研究発表会講演論文集 >DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討
【24h】

DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

机译:DNN语音合成中使用少量目标情感语音的情感应用方法研究

获取原文
获取原文并翻译 | 示例

摘要

本報告では,感情音声合成の更なる改善のために,少量の目標感情音声を用いた感情音声合成システムの構築を目的とした.学習データに含まれない感情音声を生成するDNN 音声合成方式を応用し,多様な話者・感情表現を含む音声と少量の目標感情音声データから,目標感情音声を生成する方式を提案した.客観評価実験と主観評価実験より,提案方式を用いた音響モデル(PM,AIM)と目標音声450 文のみで学習した音響モデル(SED) の性能を比較した.客観評価結果より,PM,AIM ともに450 文より少ない目標感情音声データでSED と同等の性能を示し,450文でSED を上回ることが示された.主観評価結果より,目標音声1 文を学習した音響モデルが450 文のSED と同程度の品質の音声を生成可能であることが示された.以上より,少量の目標感情音声データを用いた感情音声合成システムの構築における提案方式の有効性が示された.
机译:在本报告中,我们旨在构建一种情感语音合成系统,该系统使用少量目标情感语音来改善情感语音合成。通过应用DNN语音合成方法,该方法从包括说话者和情感表达的各种\ r \ n语音以及少量目标情感语音数据\ r \ n中生成学习数据中未包含的情感\ r \ n语音我们提出了一种生成目标情感言语的方法。根据客户的感知和主观评估实验,使用建议的方法仅使用\ n \ n声学模型(PM,AIM)学习声学模型(SED),并且目标语音为450句我们比较了性能。客观评估\ r \ n值的结果表明,在眼睛\ r \ n少于450个句子和情感语音数据的情况下,PM和AIM的性能与SED相同,而在450 \ r \ n句子下,PM和AIM的性能均超过450 SED。它是。从主观评估结果可以看出,学习目标语音一句话的声学模型可以生成质量与450句子\ r \ n的SED相同的语音。从上面可以看出,所提出的方法\ r \ n在使用少量目标情感语音数据构建情感语音合成系统\ r \ n中的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号