首页> 外国专利> Speech synthesis using one or more recurrent neural networks

Speech synthesis using one or more recurrent neural networks

机译:使用一个或多个复发性神经网络的语音合成

摘要

Aspects of the disclosure are related to synthesizing speech or other audio based on input data. Additionally, aspects of the disclosure are related to using one or more recurrent neural networks. For example, a computing device may receive text input; may determine features based on the text input; may provide the features as input to an recurrent neural network; may determine embedded data from one or more activations of a hidden layer of the recurrent neural network; may determine speech data based on a speech unit search that attempts to select, from a database, speech units based on the embedded data; and may generate speech output based on the speech data.
机译:本公开的各方面与基于输入数据的合成语音或其他音频有关。另外,本公开的各方面与使用一个或多个复发性神经网络有关。例如,计算设备可以接收文本输入;可以根据文本输入确定特征;可以提供作为反复性神经网络的输入的特征;可以从复发神经网络的隐藏层的一个或多个激活中确定嵌入数据;可以基于从数据库,基于嵌入数据的语音单元选择的语音单元搜索来确定语音数据;并且可以基于语音数据生成语音输出。

著录项

  • 公开/公告号US11069335B2

    专利类型

  • 公开/公告日2021-07-20

    原文格式PDF

  • 申请/专利权人 CERENCE OPERATING COMPANY;

    申请/专利号US201715648022

  • 发明设计人 VINCENT POLLET;ENRICO ZOVATO;

    申请日2017-07-12

  • 分类号G10L13/047;G10L13/08;G06F16/24;G06N3/04;G10L13/04;G10L13/10;G06N3/02;G06N3/08;G10L13/02;

  • 国家 US

  • 入库时间 2022-08-24 20:01:01

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号