【24h】

波形重畳型音声合成の韻律と音質のためのF0傾きモデルの利用

机译:F0倾斜模型用于叠加语音合成的波形的韵律和音质

获取原文
获取原文并翻译 | 示例
       

摘要

波形重畳型や波形接続型の音声合成では、音声素片の接続部分で基本周波数の一貫性が失われることがある。 日本語は高低アクセント言語であるため、これは詑りやアクセント型の誤りとして認識される問題となる。 特にデータベースサイズが限られているときや、音声コーパス設計時に考慮していた想定ドメイン以外の文章でそのような問題が顕著になりやすい。 本論文では、まずF0傾きモデルを用い音声素片のF0の一貫性を向上する。 さらにF0傾きモデルも利用したF0修正量探索により、適切な素片が見つからない場合にも一貫性の回復を行う。これにより入力文章の想定ドメイン内外に関わらず、音声素片の音質を活かしつつ軍しい高低アクセントで合成できるようになる。
机译:在波形叠加型或波形连接型语音合成中,基本频率的一致性可能会在语音元素的连接部分丢失。由于日语是一种高低重音的语言,因此这是一个被视为道歉或重音类型错误的问题。特别是当数据库大小有限时,或者在设计语音语料库时所考虑的假定域以外的句子中,这样的问题往往变得很明显。在本文中,我们首先使用F0倾斜模型来提高语音元素中F0的一致性。另外,即使没有找到合适的元素,使用F0倾斜模型进行的F0校正量搜索也可以恢复一致性。结果,无论输入文本是在假定域之内还是之外,都可以在充分利用语音元素的音质的同时,以军方的高音和低音进行合成。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号