首页> 外国专利> Attention network based on duration information for text-to-speech analysis

Attention network based on duration information for text-to-speech analysis

机译:关注网络基于文本到语音分析的持续时间信息

摘要

The method and apparatus include receiving a text input comprising a sequence of text components. Each time duration of the text component is determined using a duration model. A first set of spectra is generated based on the sequence of text components. A second set of spectra is generated based on the first set of spectra and the respective temporal durations of the text component sequence. A spectrogram frame is generated based on the second set of spectra. The audio waveform is generated based on the spectrogram frame. An audio waveform is provided as an output.
机译:该方法和装置包括接收包括一系列文本组件的文本输入。 使用持续时间模型确定文本组件的每次持续时间。 基于文本组件的序列生成第一组光谱。 基于第一组光谱和文本分量序列的各个时间持续时间来生成第二组光谱。 基于第二组光谱生成频谱图帧。 基于频谱图帧生成音频波形。 提供音频波形作为输出。

著录项

  • 公开/公告号KR20210144789A

    专利类型

  • 公开/公告日2021-11-30

    原文格式PDF

  • 申请/专利权人 텐센트 아메리카 엘엘씨;

    申请/专利号KR20217034088

  • 发明设计人 위 청주;루 헝;위 둥;

    申请日2020-03-05

  • 分类号G10L13/02;G10L13/047;G10L13/08;G10L13/10;

  • 国家 KR

  • 入库时间 2022-08-24 22:32:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号