首页> 中国专利> 使用对抗神经网络的联合自动语音识别和文本到语音转换

使用对抗神经网络的联合自动语音识别和文本到语音转换

摘要

本公开提供了“使用对抗神经网络的联合自动语音识别和文本到语音转换”。本文公开了一种可以使用未配对的文本和音频样本来联合解决ASR和TTS问题两者的基于端对端深度学习的系统。对抗训练方法用于生成可以单独或同时部署的更稳健的独立TTS神经网络和ASR神经网络。用于训练神经网络的过程包括使用TTS神经网络从文本样本生成音频样本,然后将生成的音频样本馈送到ASR神经网络中以重新生成文本。重新生成的文本与原始文本之间的差值用作用于训练神经网络的第一损失。类似过程用于音频样本。重新生成的音频与原始音频之间的差值用作第二损失。文本和音频鉴别器类似地用在神经网络的输出上以生成用于训练的附加损失。

著录项

  • 公开/公告号CN114093346A

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 福特全球技术公司;

    申请/专利号CN202110707998.9

  • 申请日2021-06-24

  • 分类号G10L15/16(20060101);G10L15/26(20060101);G10L25/24(20130101);G10L13/08(20130101);

  • 代理机构11278 北京连和连知识产权代理有限公司;

  • 代理人刘小峰;陈黎明

  • 地址 美国密歇根州迪尔伯恩市

  • 入库时间 2023-06-19 14:15:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-11

    实质审查的生效 IPC(主分类):G10L15/16 专利申请号:2021107079989 申请日:20210624

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号