...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張
【24h】

HMMに基づく対話音声合成における多様な韻律生成のためのコンテクストの拡張

机译:在基于HMM的交互式语音合成中扩展各种韵律生成的上下文

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

本論文では自発性の高い対話音声の合成において,多様な韻律を生成するための拡張コンテクストを提案する.HMM音声合成では音韻·韻律の変動要因をコンテクストとして考慮し学習?合成を行っているが,来の読上げ音声のためのコンテクストセットでは対話音声の韻律の多様性を実することが困難である。そこで,本論文では大規模音声コーパスである日本語話し言葉コーパス(CSJ)に収録されている対話音声を対象とし,CSJに付与されている様々な情報をコンテクストとして追加し拡張コンテクストとした.コンテクストの増加による過学習を避けるための決定木クラスタリングの新たな停止基準を導入し,従来のコンテクストと拡張コンテクストの比較を行った.その結果音素引き延ばし及びX-JToBIのトーン層ラべルに基づく情報がコンテクストとして有効であった.更に実用性を考慮して,合成時に拡張コンテクストの一部を自動的に求める手法の有効性を評価し,正解のコンテクストを用いた場合と同程度の自然性が得られることを確認した.
机译:在本文中,我们提出了一个扩展的上下文,用于在高度自发的对话声音的合成中生成各种韵律。在HMM语音合成中,通过将语音和节奏的波动因素作为上下文来进行学习和合成,但是在为下一个阅读语音设置的上下文中难以实现对话语音的节奏的多样性。因此,在本文中,我们针对以大型语音语料库日语口语语料库(CSJ)中记录的对话语音为目标,并添加了作为语境的各种信息以使其成为扩展语境。我们引入了决策树聚类的新停止准则,以避免由于上下文增加而导致的过度学习,并比较了常规上下文和扩展上下文。结果,基于X-JToBI的音调层标签和声音元素的扩展的信息作为上下文是有效的。此外,考虑到实用性,我们评估了在合成时自动查找扩展上下文的一部分的方法的有效性,并确认获得了与使用正确上下文时相同的自然度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号