首页> 外文期刊>電子情報通信学会技術研究報告 >日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価
【24h】

日本語話し言葉コーパスを用いた対話音声合成のためのコンテキストの評価

机译:使用日语口语语料评估对话语音合成的上下文

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では自発性の高い対話音声の合成において,多様な親律を生成するための拡張コンテキストの提案とその評価を行った結果を報告する.HMM 音声合成では音韻.韻律の変動要因をコンテキストとして考慮し学習・合成を行っているが,従来の読上げ音声のためのコンテキストセットでは対話音声の韻律の多様性を実現することが困難である,そこで,大規模音声コーパスである日本語話し言葉コーパス(CSJ)に含まれる様々な情報をコンテキストとして追加し拡張コンテキストとした.従来のコンテキストと拡張コンテキストの比較を行い,音素引き延ばしおよびX-JTbBI のトーン層ラベルに基づく情報がコンテキストとして有効であるという結果を得た.さらに.コンテキストの増加による遇学習を避けるための決定木クラスタリングの新たな停止基準の導入や,実用上のシステムを考慮して合成時に一部の追加コンテキストを自動推定する手法の提案を行い,その有効性を評価した.%This paper proposes an extended context set for generating the prosodic variability of spontaneous speech in HMM-based conversational speech synthesis. Since the conventional context set used for HMM-based reading-style speech synthesis is insufficient for conversational speech synthesis, we introduce new contexts derived from the Corpus of Spontaneous Japanese. We compare the context sets with and without newly introduced contexts, and the experimental results show that the contexts about phone prolongation and X-JToBI tone tier label are effective. Furthermore, we examine the stopping criteria for decision-tree clustering and the automatic estimation of a part of contexts for practical applications.
机译:在本文中,我们报告了一个提议的结果,以及对扩展上下文的评估,该扩展上下文用于在高度自发的语音合成中生成各种掌握规则。 HMM语音合成中的音素。尽管以韵律变化因子为语境进行学习和综合,但是利用用于阅读语音的常规语境设置来实现会话语音的韵律多样性是困难的。日本口语语料库(CSJ)中包含的各种信息。我们比较了常规上下文和扩展上下文,并获得了基于X-JTbBI音调层标签的音素扩展和信息作为上下文有效的结果。进一步。为决策树聚类引入新的停止准则,以通过增加上下文数量来避免学习,并提出一种在考虑实际系统及其有效性的情况下,在合成过程中自动估算一些其他上下文的方法被评估。本文提出了一个扩展的上下文集,用于在基于HMM的会话语音合成中生成自发语音的韵律变异性;由于用于基于HMM的阅读式语音合成的常规上下文集不足以进行会话语音合成,因此我们引入了新的上下文我们导出了带有或不带有新引入上下文的上下文集,实验结果表明,有关电话延长和X-JToBI音调等级标签的上下文是有效的。 -树聚类以及针对实际应用的部分上下文的自动估计。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号