【24h】

波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用

机译:使用F0倾斜模型进行节奏和波形音质叠加语音合成

获取原文
获取原文并翻译 | 示例
           

摘要

波形重畳型や波形接続型の音声合成では、音声素片の接続部分で基本周波数の一貫性が失われることがある。 日本語は高低アクセント言語であるため、これは詑りやアクセント型の誤りとして認識される問題となる。 特にデータベースサイズが限られているときや、音声コーパス設計時に考慮していた想定ドメイン以外の文章でそのような問題が顕著になりやすい。 本論文では、まずF0傾きモデルを用い音声素片のF0の一貫性を向上する。 さらにF0傾きモデルも利用したF0修正量探索により、適切な素片が見つからない場合にも一貫性の回復を行う。これにより入力文章の想定ドメイン内外に関わらず、音声素片の音質を活かしつつ軍しい高低アクセントで合成できるようになる。
机译:在波形叠加和波形语音合成中,基频的一致性可以在语音段的连接部分中丢失。 因为日语是一种高低的口音语言,这是一个被识别为错误或口音类型错误的问题。 特别是,除了在语音语料库设计时考虑的假定域之外的句子中的句子中的句子是发音的,当数据库大小受到限制时,这些问题是句子。 在本文中,首先,改善了使用F0倾斜模型的语音段的F0的完整性。 此外,即使找不到适当的段,使用F0倾斜模型的F0校正量搜索也也执行一致性恢复。 这使得可以在利用语音段的声音质量的情况下,与输入句子的预期域不同的时,这使得可以与发音段的声音质量相结合。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号