DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

机译：DNN语音合成中使用少量目标情感语音的情感应用方法研究

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

本報告では，感情音声合成の更なる改善のために，少量の目標感情音声を用いた感情音声合成システムの構築を目的とした．学習データに含まれない感情音声を生成するDNN 音声合成方式を応用し，多様な話者・感情表現を含む音声と少量の目標感情音声データから，目標感情音声を生成する方式を提案した．客観評価実験と主観評価実験より，提案方式を用いた音響モデル（PM，AIM）と目標音声450 文のみで学習した音響モデル(SED) の性能を比較した．客観評価結果より，PM，AIM ともに450 文より少ない目標感情音声データでSED と同等の性能を示し，450文でSED を上回ることが示された．主観評価結果より，目標音声1 文を学習した音響モデルが450 文のSED と同程度の品質の音声を生成可能であることが示された．以上より，少量の目標感情音声データを用いた感情音声合成システムの構築における提案方式の有効性が示された．

机译：在本报告中，我们旨在构建一种情感语音合成系统，该系统使用少量目标情感语音来改善情感语音合成。通过应用DNN语音合成方法，该方法从包括说话者和情感表达的各种\ r \ n语音以及少量目标情感语音数据\ r \ n中生成学习数据中未包含的情感\ r \ n语音我们提出了一种生成目标情感言语的方法。根据客户的感知和主观评估实验，使用建议的方法仅使用\ n \ n声学模型（PM，AIM）学习声学模型（SED），并且目标语音为450句我们比较了性能。客观评估\ r \ n值的结果表明，在眼睛\ r \ n少于450个句子和情感语音数据的情况下，PM和AIM的性能与SED相同，而在450 \ r \ n句子下，PM和AIM的性能均超过450 SED。它是。从主观评估结果可以看出，学习目标语音一句话的声学模型可以生成质量与450句子\ r \ n的SED相同的语音。从上面可以看出，所提出的方法\ r \ n在使用少量目标情感语音数据构建情感语音合成系统\ r \ n中的有效性。

著录项

来源
《日本音響学会2019年春季研究発表会講演論文集》|2019年|381085-1088|共5页
会议地点 1340-3168
作者
井上勝喜; 原直; 阿部匡伸; 井島勇祐;
展开▼
作者单位

岡山大院・自然科学研;

岡山大院・自然科学研;

岡山大院・HS 統合科学研;

NTT;

展开▼
会议组织
原文格式 PDF
正文语种 jpn
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. DNN音声合成における感情付与のためのモデル構造の検討 [J] . 井上勝喜, 原直, 阿部匡伸, 電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2017,第105期

机译：DNN语音合成情绪赋予模型结构的检查
2. DNN音声合成における感情付与のためのモデル構造の検討 [J] . 井上勝喜, 原直, 阿部匡伸, 電子情報通信学会技術研究報告. 音声. Speech . 2017,第106期

机译：DNN语音合成情绪赋予模型结构的研究
3. 感情音声データベースJTESを用いた感情音声認識におけるモデル適応の性能向上の検討 [J] . 相澤佳孝, 加藤正治, 小坂哲夫, 電子情報通信学会技術研究報告. 音声. Speech . 2017,第368期

机译：用情感数据库JTES检查情绪语音识别模型适应性能提高
4. DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討 [C] . 井上勝喜, 原直, 阿部匡伸, 日本音響学会研究発表会 . 2019

机译：DNN语音合成中使用少量目标情绪声音的情感应用方法检查
5. 吃音のある成人における注意?感情制御に着目した吃音症状?社交不安の維持メカニズムの検討 [D] . 灰谷知純, (KAKEN - 研究者検索:90804500, ) 2019

机译：口吃成人的注意力和情绪控制口吃症状集中于社交焦虑的控制机制
6. 小学校における「体ほぐしの運動」の目標設定に関する学年別の検討－気づき・調整・交流をねらいとした運動実践に対する評価の違いから－ [O] . 栗原康明 2009

机译：从年级开始对小学“身体放松运动”目标设定的检验-从对意识，调节和互动的运动实践评价中的差异

DNN音声合成における少量の目標感情音声を用いた感情付与方式の検討

摘要

著录项

相似文献

相关主题

期刊订阅